「日付」列を持つ Pandas DataFrame があります。次に、今後 2 か月以外の日付を持つ DataFrame のすべての行をフィルター処理する必要があります。基本的に、今後 2 か月以内の行のみを保持する必要があります。
これを達成するための最善の方法は何でしょうか?
ベストアンサー1
日付列がインデックスである場合は、ラベルベースのインデックスには .loc を使用し、位置ベースのインデックスには .iloc を使用します。
例えば:
df.loc['2014-01-01':'2014-02-01']
詳細はこちらhttp://pandas.pydata.org/pandas-docs/stable/dsintro.html#インデックス選択
列がインデックスでない場合は、次の 2 つの選択肢があります。
- それをインデックスにする(時系列データの場合は一時的または永続的)
df[(df['date'] > '2013-01-01') & (df['date'] < '2013-02-01')]
見るここ一般的な説明
注意: .ix は非推奨です。