.h5 ファイルに保存されているデータセットをダウンロードしました。特定の列のみを保持し、その中のデータを操作できるようにする必要があります。
これを実行するために、私はパンダのデータフレームにロードしようとしました。私は以下を使用しようとしました:
pd.read_hdf(path)
しかし、私はこう思います:No dataset in HDF5 file.
私はSOで答えを見つけました(条件付きでHDF5ファイルをpandas DataFrameに読み込む) ですが、条件は必要ありません。回答では、ファイルの作成方法に関する条件が追加されていますが、私はファイルの作成者ではないので、それについては何もできません。
h5pyも使ってみました:
df = h5py.File(path)
しかし、これは簡単に操作できるものではなく、列を取得できないようです ( を使用している列の名前のみdf.keys()
)。これを行う方法について何かアイデアはありますか?
ベストアンサー1
これらを Pandas に読み込む最も簡単な方法は、 に変換し、h5py
に変換してから に変換することです。次のようになります。np.array
DataFrame
df = pd.DataFrame(np.array(h5py.File(path)['variable_1']))