ファイル内の他の場所にある行を抽出します。

Question

ファイルに関連するデータ行が1つ含まれており、残りは空であるか、#;で始まるコメント行があるようです。しかし、最後は維持したいヘッダーです。問題はコメントの行数が異なるようです。

ジョブが実際に「構文解析された」サマリーファイルに出力するためにヘッダーとこのデータラインを抽出する場合は、次のように、開始パターンで識別されたヘッダー以外の文字awkで始まるすべての空行または行を無視するように指示できます。。## V-(D)-J

awk '$0~/^# V-\(D\)-J/ || ($0!~/^#/ && NF>0) {print}' input_file > parsed_file

一方、ファイルに複数のデータ行が含まれていて、ヘッダーと最初のデータ行のみを印刷したい場合は、コマンドは次のようになりawkます。

awk '$0~/^# V-\(D\)-J/ {print} ($0!~/^#/ && NF>0) {print;exit}' input_file > parsed_file

シェルループでこれを行うには、次のようにします。

for file in *LC.fa
do
    infile="${file%.*}.fmt7"
    outfile="${file%.*}.parsed.txt"
    awk '$0~/^# V-\(D\)-J/ || ($0!~/^#/ && NF>0) {print}' "$infile" > "$outfile"
done

または

for file in *LC.fa
do
    infile="${file%.*}.fmt7"
    outfile="${file%.*}.parsed.txt"
    awk '$0~/^# V-\(D\)-J/ {print} ($0!~/^#/ && NF>0) {print;exit}' "$infile" > "$outfile"
done

それぞれ。

lsループは、の出力が解析されるにつれてより強力になります。つまり、強くお勧めしません。

`awk`コマンドのいくつかの説明

awk条件が「メイン」プログラムスペースにあり、そのルールがの「条件付きルール」構文に適用されます{ ... }。

最初の例では、条件と規則があります。

逆参照により、行が正規$0表現と一致する場合^# V-$D$-J、つまり^文字列（）で始まります。V-(D)-J
または（||）もちろんいいえ#（$0!~/^#/式）で始まるそしてまた空ではありません。つまり、「フィールド区切り文字」変数で定義されたフィールドが1つ以上あります（NF>0単純に短縮することもできます）（デフォルトは空白）NF

printそれから行があります。

これにより、ヘッダーと連続したデータ行が印刷されます。

2番目の例では、関連ルールには2つの条件があります。

行が文字列で始まる場合はその行です# V-(D)-J。print
行いいえで始まり#、空でないprint場合はすぐにファイル処理をexit終了します。awk

このようにして「ヘッダー」が印刷されますが、最初の「データ」行に出会い、印刷されると実行を停止し、各ファイルの最初のデータ行と一緒にヘッダーのみを印刷します。

Answer 1

ファイルに関連するデータ行が1つ含まれており、残りは空であるか、#;で始まるコメント行があるようです。しかし、最後は維持したいヘッダーです。問題はコメントの行数が異なるようです。

ジョブが実際に「構文解析された」サマリーファイルに出力するためにヘッダーとこのデータラインを抽出する場合は、次のように、開始パターンで識別されたヘッダー以外の文字awkで始まるすべての空行または行を無視するように指示できます。。## V-(D)-J

awk '$0~/^# V-\(D\)-J/ || ($0!~/^#/ && NF>0) {print}' input_file > parsed_file

一方、ファイルに複数のデータ行が含まれていて、ヘッダーと最初のデータ行のみを印刷したい場合は、コマンドは次のようになりawkます。

awk '$0~/^# V-\(D\)-J/ {print} ($0!~/^#/ && NF>0) {print;exit}' input_file > parsed_file

シェルループでこれを行うには、次のようにします。

for file in *LC.fa
do
    infile="${file%.*}.fmt7"
    outfile="${file%.*}.parsed.txt"
    awk '$0~/^# V-\(D\)-J/ || ($0!~/^#/ && NF>0) {print}' "$infile" > "$outfile"
done

または

for file in *LC.fa
do
    infile="${file%.*}.fmt7"
    outfile="${file%.*}.parsed.txt"
    awk '$0~/^# V-\(D\)-J/ {print} ($0!~/^#/ && NF>0) {print;exit}' "$infile" > "$outfile"
done

それぞれ。

lsループは、の出力が解析されるにつれてより強力になります。つまり、強くお勧めしません。

`awk`コマンドのいくつかの説明

awk条件が「メイン」プログラムスペースにあり、そのルールがの「条件付きルール」構文に適用されます{ ... }。

最初の例では、条件と規則があります。

逆参照により、行が正規$0表現と一致する場合^# V-$D$-J、つまり^文字列（）で始まります。V-(D)-J
または（||）もちろんいいえ#（$0!~/^#/式）で始まるそしてまた空ではありません。つまり、「フィールド区切り文字」変数で定義されたフィールドが1つ以上あります（NF>0単純に短縮することもできます）（デフォルトは空白）NF

printそれから行があります。

これにより、ヘッダーと連続したデータ行が印刷されます。

2番目の例では、関連ルールには2つの条件があります。

行が文字列で始まる場合はその行です# V-(D)-J。print
行いいえで始まり#、空でないprint場合はすぐにファイル処理をexit終了します。awk

このようにして「ヘッダー」が印刷されますが、最初の「データ」行に出会い、印刷されると実行を停止し、各ファイルの最初のデータ行と一緒にヘッダーのみを印刷します。

ファイル内の他の場所にある行を抽出します。

ベストアンサー1

`awk`コマンドのいくつかの説明

おすすめ記事

ベストアンサー1

awkコマンドのいくつかの説明

おすすめ記事

`awk`コマンドのいくつかの説明