Perlまたはgrepを使用してテキストファイルから特定のテキストをコピーする

Question

これには実際のタグパーサーを使用する必要がありますが、少なくともフォーマット記述を次のように解釈する必要があります。

<page line one
line two /page>
<page line three
line four /page>
<page line five
line six /page>

クイックawkソリューション¹が許可されている場合は、これを行うことができます。

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=RS} FNR==pagenum {print} 1' file

またはそれほど不思議ではありません。

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=RS}; FNR==pagenum {print}; {print}' file

ここでコピーしたいページ番号はシェルの引数として渡されます-v pagenum=。

最後のタグの後に「stuff」がある場合、上記/page>の式はそれを不完全なレコードとして扱い、偽の最終/page>レコード区切り文字を追加できます。この場合、次の修正された式がよりうまく機能する可能性があります。

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=""; OFS=""} FNR==pagenum {print $0,RT} {print $0,RT}' file

Answer 1

これには実際のタグパーサーを使用する必要がありますが、少なくともフォーマット記述を次のように解釈する必要があります。

<page line one
line two /page>
<page line three
line four /page>
<page line five
line six /page>

クイックawkソリューション¹が許可されている場合は、これを行うことができます。

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=RS} FNR==pagenum {print} 1' file

またはそれほど不思議ではありません。

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=RS}; FNR==pagenum {print}; {print}' file

ここでコピーしたいページ番号はシェルの引数として渡されます-v pagenum=。

最後のタグの後に「stuff」がある場合、上記/page>の式はそれを不完全なレコードとして扱い、偽の最終/page>レコード区切り文字を追加できます。この場合、次の修正された式がよりうまく機能する可能性があります。

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=""; OFS=""} FNR==pagenum {print $0,RT} {print $0,RT}' file

おすすめ記事