正規表現が現れるたびにファイルを分割する方法は？

Question

ほぼ完了しました:

awk '/[0-9]-[0-9]{2}\/[[:upper:]]+-[0-9]{6}/ {
       if (file) close (file)
       file = sprintf("split%05i.txt", ++i)
     }
     file {print > file}' input.txt

パターンに一致する{ if... }行に対してコードブロックを実行しようとしているので。[0-9].../.../

2番目のコードブロックは{print > file}すべてのレコードセットに対して実行され、条件として使用されます。filefile

ここでパターンは、順番に処理される各レコードが各行の内容なので（基本レコード区切り記号（）はです）、レコードに改行文字が含まれないため\n意味がありません。また、ここに正規表現を固定したくありません（および）。awkRS\n^$

.+より具体的に説明するためにあなたのものを置き換えました[[:upper:]]+。たとえば、の場合.+と一致しますblah 5-10/2 blah blah €1000000。受け入れたいものに応じて調整が必要な場合がありますPNLP。

また、パターンに一致する文字列が含まれているため、一致することに注意してください（太字で表示）。blah 1234-56/XX-1234567890 blah

コードが具体的ではないため、ginを削除しました。ただし、上記の/演算子をサポートしていないいくつかのawk実装がまだあることに注意してください（POSIX要件にもかかわらず）。それが利用可能であることを知っている場合は、それを使用して機能していることを確認することをお勧めします。gawkgawk{2}{6}gawk

Answer 1