Python Pandasで基準に基づいてデータフレームの最初の行を取得する質問する

Question

このチュートリアルpandas のスライスに非常に適しています。ぜひチェックしてみてください。いくつかのスニペットを紹介します... 条件付きでデータフレームをスライスするには、次の形式を使用します。

>>> df[condition]

これにより、を使用してインデックスを作成できるデータフレームのスライスが返されますiloc。例を次に示します。

A > 3 となる最初の行を取得します (行 2 を返します)

>>> df[df.A > 3].iloc[0]
A    4
B    6
C    3
Name: 2, dtype: int64

実際に必要なのが行番号である場合は、を使用するのではなくiloc、を使用しますdf[df.A > 3].index[0]。

A > 4 AND B > 3 となる最初の行を取得します。

>>> df[(df.A > 4) & (df.B > 3)].iloc[0]
A    5
B    4
C    5
Name: 4, dtype: int64

A > 3 AND (B > 3 OR C > 2) となる最初の行を取得します (行 2 を返します)

>>> df[(df.A > 3) & ((df.B > 3) | (df.C > 2))].iloc[0]
A    4
B    6
C    3
Name: 2, dtype: int64

さて、最後のケースでは、降順でソートされたフレームを返すデフォルトのケースを処理する関数を記述できます。

>>> def series_or_default(X, condition, default_col, ascending=False):
...     sliced = X[condition]
...     if sliced.shape[0] == 0:
...         return X.sort_values(default_col, ascending=ascending).iloc[0]
...     return sliced.iloc[0]
>>> 
>>> series_or_default(df, df.A > 6, 'A')
A    5
B    4
C    5
Name: 4, dtype: int64

予想どおり、行 4 が返されます。

Answer 1