大容量ファイルを分割するためにバイトを直接分割するのは安全ですか？

Question

任意のバイトポイントでバイナリファイルを分割できます。

テキストファイルを分割すると、任意のバイトポイントで分割できますが、マルチバイトUnicode文字の途中で分割される可能性が高くなります。ただし、内容を解釈する前にファイルをリンクしても問題ありません。（また、内容を処理する前にバイナリの一部を連結する必要があるので違いはありません。）

Pythonコードのように可変ビット出力フラグメントを使用することは、cat myBigFile.tar.gz.*.part単純なコンテンツを使用して元のコンテンツを再構成できないことを意味します。（26部品の場合、1、10、11、12…19、2、20、21…26、3、4、5、6、7、8、9の順に表示されます。）

以下は、myBigFile.tar.gz独自の命名規則を使用して2 GBの部分に分割する方法です。

split --bytes=2G --numeric-suffixes=1 --suffix-length=2 --additional-suffix=.part myBigFile.tar.gz myBigFile.tar.gz.

man splitコマンドラインスイッチの詳細については、リソースを参照してください。

出力ファイルの例：

myBigFile.tar.gz.01.part
myBigFile.tar.gz.02.part
myBigFile.tar.gz.03.part
…

これらのファイルがある場合は、単純なコマンドとシェルワイルドカードを使用して元のファイルを再構成できます。

cat myBigFile.tar.gz.??.part >myBigFile.tar.gz

Answer 1