grep を使用して、パターンに一致する最初の行のすべての行を別のパターンとして返す

Question

見つかったように、grep -A静的な数のコンテキスト行だけを指定できるため、柔軟ではありません。

awk代わりに、選択したシーケンスが発生するタイミングを検出し、条件と一致しない他のシーケンスヘッダが見つかるまでそれを出力するコマンドは次のとおりです。

awk -v name='trnF' -v OFS=':\t' '
    FNR == 1 && NR > 1 { print "--" }
    /^>/ { out=0 }
    $0 ~ "^>.*" name { out=1 }
    out == 1 { print FILENAME, $0 }' files

このオプションはコードの変数に-v name=something割り当てられ、指定された文字列を含むfastaヘッダー行と一致する正規表現の一部として使用されます。somethingnameawk

最後の段落の出力はawk次のとおりです。

file:   >species one; trnF(ggc)
file:   GGCCC
file:   AACGC
--
file1:  >species one; trnF(ggc)
file1:  GGCCC
file1:  AACGC
--

（:次のタブはファイル名とデータの区切り文字として使用され、OFSコマンドラインで別の項目に設定することで変更できます-v OFS=somethingelse。）

Answer 1

見つかったように、grep -A静的な数のコンテキスト行だけを指定できるため、柔軟ではありません。

awk代わりに、選択したシーケンスが発生するタイミングを検出し、条件と一致しない他のシーケンスヘッダが見つかるまでそれを出力するコマンドは次のとおりです。

awk -v name='trnF' -v OFS=':\t' '
    FNR == 1 && NR > 1 { print "--" }
    /^>/ { out=0 }
    $0 ~ "^>.*" name { out=1 }
    out == 1 { print FILENAME, $0 }' files

このオプションはコードの変数に-v name=something割り当てられ、指定された文字列を含むfastaヘッダー行と一致する正規表現の一部として使用されます。somethingnameawk

最後の段落の出力はawk次のとおりです。

file:   >species one; trnF(ggc)
file:   GGCCC
file:   AACGC
--
file1:  >species one; trnF(ggc)
file1:  GGCCC
file1:  AACGC
--

（:次のタブはファイル名とデータの区切り文字として使用され、OFSコマンドラインで別の項目に設定することで変更できます-v OFS=somethingelse。）

grep を使用して、パターンに一致する最初の行のすべての行を別のパターンとして返す

ベストアンサー1

おすすめ記事