Awk - 生成されたファイル名を標準出力として指定しながら、各バイトを独自のファイルに分割します。

Question

GNUを使用すると、awk次のことができます。

LC_ALL=C gawk -v RS='.{1}' '
  {
    file = "filename" ++n
    print file
    printf "%s", RT > file
    close(file)
  }' < input

ただし、ほとんどのファイルシステムでバイトごとに1つのファイルを作成することを考慮すると、ディスク容量（ほとんどのファイルシステムでは1バイトのファイルがまだ数KBのディスク容量を占めるため）やinodeがすぐに不足する可能性があります。そうしないと、パフォーマンスが非常に悪くなる可能性があります。数十万バイトの入力

LC_ALL=C.文字の代わりにバイトを一致させるために使用されます。
RS='.{1}'レコード区切り文字を1単一文字（で囲まれた単一バイトLC_ALL=C）に設定します。RS=.レコード区切り文字はドット文字であるため、機能しません。正規表現と見なすにはRS複数の文字が必要です。また動作しますが、テストの結果、3つのうち、これが最も効果的であることがわかりました。gawk(.).|..{1}
RT一致するテキストが含まれていますRS。

RS正規表現としてバイナリデータを処理でき、RT非標準拡張です。RTAFAIK GNU専用です。

Answer 1

GNUを使用すると、awk次のことができます。

LC_ALL=C gawk -v RS='.{1}' '
  {
    file = "filename" ++n
    print file
    printf "%s", RT > file
    close(file)
  }' < input

ただし、ほとんどのファイルシステムでバイトごとに1つのファイルを作成することを考慮すると、ディスク容量（ほとんどのファイルシステムでは1バイトのファイルがまだ数KBのディスク容量を占めるため）やinodeがすぐに不足する可能性があります。そうしないと、パフォーマンスが非常に悪くなる可能性があります。数十万バイトの入力

LC_ALL=C.文字の代わりにバイトを一致させるために使用されます。
RS='.{1}'レコード区切り文字を1単一文字（で囲まれた単一バイトLC_ALL=C）に設定します。RS=.レコード区切り文字はドット文字であるため、機能しません。正規表現と見なすにはRS複数の文字が必要です。また動作しますが、テストの結果、3つのうち、これが最も効果的であることがわかりました。gawk(.).|..{1}
RT一致するテキストが含まれていますRS。

RS正規表現としてバイナリデータを処理でき、RT非標準拡張です。RTAFAIK GNU専用です。

Awk - 生成されたファイル名を標準出力として指定しながら、各バイトを独自のファイルに分割します。

ベストアンサー1

おすすめ記事