Rでは、列名に基づいて列インデックスを取得する必要がある場合は、次のようにします。
idx <- which(names(my_data)==my_colum_name)
pandas データフレームで同じことを行う方法はありますか?
ベストアンサー1
はい、以下を使用できます.get_loc()
:
In [45]: df = DataFrame({"pear": [1,2,3], "apple": [2,3,4], "orange": [3,4,5]})
In [46]: df.columns
Out[46]: Index([apple, orange, pear], dtype=object)
In [47]: df.columns.get_loc("pear")
Out[47]: 2
正直に言うと、私自身はこれを必要とすることはあまりありません。通常、名前によるアクセスは私が望むこと ( df["pear"]
、df[["apple", "orange"]]
、またはdf.columns.isin(["orange", "pear"])
) を実行しますが、インデックス番号が必要な場合も確かにあります。