Python の Pandas ライブラリを使用して .xlsx ファイルを読み取り、そのデータを postgreSQL テーブルに移植したいと考えています。
今まで私ができたことは以下の通りです。
import pandas as pd
data = pd.ExcelFile("*File Name*")
これで、ステップが正常に実行されたことがわかりましたが、読み込まれた Excel ファイルをどのように解析して、Excel 内のデータが変数データ内のデータにどのようにマップされるかを理解できるかを知りたいです。
間違っていなければ、データは Dataframe オブジェクトであると学習しました。では、この Dataframe オブジェクトを解析して、各行を 1 行ずつ抽出するにはどうすればよいでしょうか。
ベストアンサー1
DataFrame
私は通常、シートごとに を含む辞書を作成します。
xl_file = pd.ExcelFile(file_name)
dfs = {sheet_name: xl_file.parse(sheet_name)
for sheet_name in xl_file.sheet_names}
sheet_name=None
更新: pandas バージョン 0.21.0 以降では、以下を渡すことでこの動作をよりきれいに実現できますread_excel
。
dfs = pd.read_excel(file_name, sheet_name=None)
0.20 以前では、これはsheetname
次のとおりでしたsheet_name
(これは現在非推奨で、代わりに上記が採用されています)。
dfs = pd.read_excel(file_name, sheetname=None)