行番号セットの場合...他のパターンの最初の発生と最後の発生の間の内容を抽出します。

Question

1) 特定の行の抽出

4行目の例では、3行目を削除して1行目、2行目、4行目を簡単に抽出できます。

sed 3d file

ただし、ファイルがより複雑になる可能性があるため、より一般的な解決策は次のとおりです。

sed -e 1b -e 2b -e 4b -e d file

したがって、保持する必要がある各行に対してスクリプトの最後に移動して、残りのbファイルを削除できます。

より長い行番号のリストについては、スクリプトを生成する必要があるかもしれません。

sed $(for i in 1 2 4; do echo "-e ${i}b"; done) -e d file

ところで、問題は行番号ではなく、行に<book>sがあるかどうかのようです。これが本当なら、行番号を忘れて、次のことをお勧めします。

sed '/<book>/!d'

2) コンテンツ抽出

正規表現は*この種の操作には適していません。これが私の個人的なバージョンに一致する部分だけを置き換えるsedコマンドオプションがある理由です。oso

sed '/<book>/!d;s_<book>.*</book>_&_o'

しかし、それはあなたには効果がないので、より正規表現のジャグリングが必要です。

sed '/<book>/!d;s_<book>_\n&_;s_.*\n__;s_\(.*</book>\).*_\1_' file

sedあなたのバージョンが代替文字列をサポートしていない場合は、\n実際の改行文字を使用してください（バックスラッシュでエスケープされます）。

sed '/<book>/!d;s_<book>_\
&_;s_.*\n__;s_\(.*</book>\).*_\1_' file

Answer 1