大きな.gzファイルがあります。私はそれを100個のより小さなgzipファイルに分割したいと思います。各ファイルは個別に解凍できます。つまり、私は.gzファイルを解凍するために再度集める必要がある塊に切り取る方法を探していません。それぞれの小さなファイルを個別に解凍できるようにしたいです。
ファイル全体を再圧縮せずに実行できますか?
元のファイルを圧縮しても大丈夫です--rsyncable
か? (「圧縮されたデータストリームの内部構造を定期的にリセットしてrsyncプログラムをよりよく満たす」。これらのリセットポイントが分割に最適な場所であるように聞こえ、前面にヘッダを追加することもできます。)
他の圧縮形式にも使用できますか?私はbzip2
これがうまくいくと思います。なぜなら、それは塊に圧縮されているからです。
ベストアンサー1
大容量ファイルを分割してマージすることは効率的ですが、基本情報がデータセット全体に分散しているため、圧縮ファイルの個々の部分を解凍することは不可能です。別の方法は、圧縮されていないファイルを分割し、個々の部分を圧縮することです。これで各セクションを解凍できます。しかし、なぜ?追加の処理を行う前に、解凍したすべての部分をマージする必要があります。