csplitは提供された正規表現を認識しません。

Question

Csplitはテキストユーティリティです。ラインベースです。パターンは/FORM/「FORM含む行」を意味します。行は LF (newline とも呼ばれ、 ^J, … で書ける newline) 以外のバイトシーケンスであり、その後\nには LF バイト (または GNU ユーティリティを使用する場合ファイルの末尾に) があります。したがって、観察された「ゴミ」は、FORM以前のLF文字と部分文字列の間のすべてです。

マニュアルページと--help簡単な説明では、コマンドが何をしているのかを既に知っていると仮定しているので、説明なしで「断片」だけに言及しています。あなたは読まなければなりません完全な文書その部分の説明を確認してください。

csplitではあなたが望むことはできません。 GNU awkを使用してこれを行うことができます。（他のバージョンのawkには、任意のレコード区切り文字やNULLバイト処理のサポートなど、必要な機能がない可能性があります。）

gawk -v RS='FORM' -v ORS='' '{
    print "FORM" $0 >sprintf("sample-%04d.aif", n++)
}' DATA.DAT

ただし、圧縮データに正確に4バイトが含まれていると、FORM誤った場所で切り捨てられる可能性があります。これは手動チェックのワンタイムタスクには十分ですが、信頼できるものが必要な場合はフォーマット認識ツールを使用することをお勧めします。

Answer 1

Csplitはテキストユーティリティです。ラインベースです。パターンは/FORM/「FORM含む行」を意味します。行は LF (newline とも呼ばれ、 ^J, … で書ける newline) 以外のバイトシーケンスであり、その後\nには LF バイト (または GNU ユーティリティを使用する場合ファイルの末尾に) があります。したがって、観察された「ゴミ」は、FORM以前のLF文字と部分文字列の間のすべてです。

マニュアルページと--help簡単な説明では、コマンドが何をしているのかを既に知っていると仮定しているので、説明なしで「断片」だけに言及しています。あなたは読まなければなりません完全な文書その部分の説明を確認してください。

csplitではあなたが望むことはできません。 GNU awkを使用してこれを行うことができます。（他のバージョンのawkには、任意のレコード区切り文字やNULLバイト処理のサポートなど、必要な機能がない可能性があります。）

gawk -v RS='FORM' -v ORS='' '{
    print "FORM" $0 >sprintf("sample-%04d.aif", n++)
}' DATA.DAT

ただし、圧縮データに正確に4バイトが含まれていると、FORM誤った場所で切り捨てられる可能性があります。これは手動チェックのワンタイムタスクには十分ですが、信頼できるものが必要な場合はフォーマット認識ツールを使用することをお勧めします。

csplitは提供された正規表現を認識しません。

ベストアンサー1

おすすめ記事