なぜピクルスは記憶を食べるのか？質問する

Question

Pickle は大量の RAM を消費します。ここで説明を参照してください。http://www.shocksolution.com/2010/01/storing-large-numpy-arrays-on-disk-python-pickle-vs-hdf5adsf/

Pickle はなぜこれほど多くのメモリを消費するのでしょうか?その理由は、HDF がバイナリデータパイプであるのに対し、Pickle はオブジェクトシリアル化プロトコルだからです。Pickle は実際には、オブジェクトを一連のオペコードに変換してディスクに書き込む単純な仮想マシン (VM) で構成されています。何かをアンピクルするには、VM がオペコードを読み取って解釈し、オブジェクトを再構築します。このアプローチの欠点は、VM がディスクに書き込む前に、オブジェクトの完全なコピーをメモリ内に構築する必要があることです。

Pickle は、ほとんどの場合メモリ消費がそれほど問題にならないため、小規模なユースケースやテストに最適です。

大量のファイルや大きなファイルをダンプしてロードする必要がある集中的な作業の場合は、データを保存する別の方法を検討する必要があります (例: hdf、オブジェクト用に独自のシリアル化/逆シリアル化メソッドを作成するなど)。

Answer 1

Pickle は大量の RAM を消費します。ここで説明を参照してください。http://www.shocksolution.com/2010/01/storing-large-numpy-arrays-on-disk-python-pickle-vs-hdf5adsf/

Pickle はなぜこれほど多くのメモリを消費するのでしょうか?その理由は、HDF がバイナリデータパイプであるのに対し、Pickle はオブジェクトシリアル化プロトコルだからです。Pickle は実際には、オブジェクトを一連のオペコードに変換してディスクに書き込む単純な仮想マシン (VM) で構成されています。何かをアンピクルするには、VM がオペコードを読み取って解釈し、オブジェクトを再構築します。このアプローチの欠点は、VM がディスクに書き込む前に、オブジェクトの完全なコピーをメモリ内に構築する必要があることです。

Pickle は、ほとんどの場合メモリ消費がそれほど問題にならないため、小規模なユースケースやテストに最適です。

大量のファイルや大きなファイルをダンプしてロードする必要がある集中的な作業の場合は、データを保存する別の方法を検討する必要があります (例: hdf、オブジェクト用に独自のシリアル化/逆シリアル化メソッドを作成するなど)。

なぜピクルスは記憶を食べるのか？質問する

ベストアンサー1

おすすめ記事