パンダデータフレームの行のサブセットを変更する質問する

Question

使用.locラベルベースのインデックスの場合:

df.loc[df.A==0, 'B'] = np.nan

このdf.A==0式は、行にインデックスを付け、'B'列を選択するブールシリーズを作成します。また、これを使用して列のサブセットを変換することもできます。例:

df.loc[df.A==0, 'B'] = df.loc[df.A==0, 'B'] / 2

私はパンダの内部構造について十分に理解していないので、なぜそれが機能するのか正確にはわかりませんが、基本的な問題は、データフレームにインデックスを付けると、結果のコピーが返されることもあれば、元のオブジェクトのビューが返されることもあるということです。ドキュメントによるとこここの動作は、基礎となる numpy の動作に依存します。設定の場合は、すべてに 1 回の操作でアクセスする ([1][2] ではなく) 方がうまくいく可能性が高いことがわかりました。

Answer 1

使用.locラベルベースのインデックスの場合:

df.loc[df.A==0, 'B'] = np.nan

このdf.A==0式は、行にインデックスを付け、'B'列を選択するブールシリーズを作成します。また、これを使用して列のサブセットを変換することもできます。例:

df.loc[df.A==0, 'B'] = df.loc[df.A==0, 'B'] / 2

私はパンダの内部構造について十分に理解していないので、なぜそれが機能するのか正確にはわかりませんが、基本的な問題は、データフレームにインデックスを付けると、結果のコピーが返されることもあれば、元のオブジェクトのビューが返されることもあるということです。ドキュメントによるとこここの動作は、基礎となる numpy の動作に依存します。設定の場合は、すべてに 1 回の操作でアクセスする ([1][2] ではなく) 方がうまくいく可能性が高いことがわかりました。

パンダデータフレームの行のサブセットを変更する質問する

ベストアンサー1

おすすめ記事