Pandas read_csv 関数でロード時に行をフィルターするにはどうすればよいですか? 質問する

Question

CSV ファイルが pandas オブジェクトにロードされる前に行をフィルタリングするオプションはありません。

ファイルをロードしてからを使用してフィルタリングするdf[df['field'] > constant]か、ファイルが非常に大きく、メモリ不足が心配な場合は、反復子を使用して、ファイルのチャンクを連結するときにフィルタを適用します。例:

import pandas as pd
iter_csv = pd.read_csv('file.csv', iterator=True, chunksize=1000)
df = pd.concat([chunk[chunk['field'] > constant] for chunk in iter_csv])

chunksize利用可能なメモリに合わせて変更することができます。ここ詳細については。

Answer 1

CSV ファイルが pandas オブジェクトにロードされる前に行をフィルタリングするオプションはありません。

ファイルをロードしてからを使用してフィルタリングするdf[df['field'] > constant]か、ファイルが非常に大きく、メモリ不足が心配な場合は、反復子を使用して、ファイルのチャンクを連結するときにフィルタを適用します。例:

import pandas as pd
iter_csv = pd.read_csv('file.csv', iterator=True, chunksize=1000)
df = pd.concat([chunk[chunk['field'] > constant] for chunk in iter_csv])

chunksize利用可能なメモリに合わせて変更することができます。ここ詳細については。

Pandas read_csv 関数でロード時に行をフィルターするにはどうすればよいですか? 質問する

ベストアンサー1

おすすめ記事