hdf5 ファイルを pandas データフレームに変換する質問する

2024-07-07 • tag-icon

python pandas hdf5

.h5 ファイルに保存されているデータセットをダウンロードしました。特定の列のみを保持し、その中のデータを操作できるようにする必要があります。

これを実行するために、私はパンダのデータフレームにロードしようとしました。私は以下を使用しようとしました:

pd.read_hdf(path)

しかし、私はこう思います:No dataset in HDF5 file.

私はSOで答えを見つけました（条件付きでHDF5ファイルをpandas DataFrameに読み込む) ですが、条件は必要ありません。回答では、ファイルの作成方法に関する条件が追加されていますが、私はファイルの作成者ではないので、それについては何もできません。

h5pyも使ってみました:

df = h5py.File(path)

しかし、これは簡単に操作できるものではなく、列を取得できないようです ( を使用している列の名前のみdf.keys())。これを行う方法について何かアイデアはありますか?

これらを Pandas に読み込む最も簡単な方法は、に変換し、h5pyに変換してからに変換することです。次のようになります。np.arrayDataFrame

df = pd.DataFrame(np.array(h5py.File(path)['variable_1']))

おすすめ記事