ディスク上にNumPy配列を保存する最良の方法質問する

Question

NumPy 配列を保存するさまざまな方法のパフォーマンス (スペースと時間) を比較しました。ファイルごとに複数の配列をサポートしている方法はほとんどありませんが、いずれにしても役に立つかもしれません。

Npy とバイナリファイルはどちらも、高密度データに対して非常に高速で小さいです。データがまばらであったり、非常に構造化されている場合は、圧縮された npz を使用すると、多くのスペースを節約できますが、読み込みに時間がかかります。

移植性が問題になる場合は、npy よりもバイナリの方が適しています。人間が読みやすいことが重要な場合は、パフォーマンスを大幅に犠牲にする必要がありますが、csv を使用するとかなりうまく実現できます (もちろん、これも非常に移植性があります)。

詳細とコードは以下から入手できます。githubリポジトリ。

Answer 1

NumPy 配列を保存するさまざまな方法のパフォーマンス (スペースと時間) を比較しました。ファイルごとに複数の配列をサポートしている方法はほとんどありませんが、いずれにしても役に立つかもしれません。

Npy とバイナリファイルはどちらも、高密度データに対して非常に高速で小さいです。データがまばらであったり、非常に構造化されている場合は、圧縮された npz を使用すると、多くのスペースを節約できますが、読み込みに時間がかかります。

移植性が問題になる場合は、npy よりもバイナリの方が適しています。人間が読みやすいことが重要な場合は、パフォーマンスを大幅に犠牲にする必要がありますが、csv を使用するとかなりうまく実現できます (もちろん、これも非常に移植性があります)。

詳細とコードは以下から入手できます。githubリポジトリ。

おすすめ記事