一致リストからデータを取得する

Question

提供されたソリューションを少し変更するとザイルズ存在するこれ質問（とも呼ばれる）jw013output.txt）、順序が入力シーケンスに基づいており、質問に記載されている順序とは異なることを除いて、要求された効果を得ることができます。

awk -v patterns_file=list.txt '
BEGIN {
  while (getline < patterns_file)
    patterns_array[">" $0] = 1
  close(patterns_file)
}
$0 in patterns_array { print; getline; print }
' sample[1-3].txt

出力：

>GETID_17049_knownids_1/2_Confidence_0.625_Length_2532
sampletextforsample1
>GETID_11084_knownids_3/3_Confidence_0.600_Length_1451
sampletextforsample2
>GETID_17049_knownids_1/2_Confidence_0.625_Length_2532
sampletextforsample3
>GETID_15916_knownids_10/11_Confidence_0.324_Length_1825
sample2textforsample3

編集する

複数行のレコードが機能するようにするには、適切なレコード区切り文字（RS）を使用します。あなたの場合は、greater-thanファイルの先頭（^>）またはnew-line後ろgreater-than（\n>）またはnew-lineファイルの終わり（\n$）に設定するのが良いオプションです。提供された入力について。

次のように動作する必要があります。

awk -v patterns_file=patterns.txt '
BEGIN {
  while (getline < patterns_file) 
    patterns_array[$0] = 1
  close(patterns_file)
  RS="^>|\n>|\n$"
}
$1 in patterns_array { print ">" $0 }
' sample[1-3].txt

編集2

各レコードを一度だけ出力するには、patterns_array後の出力からそのレコードを削除します。

awk -v patterns_file=patterns.txt '
BEGIN {
  while (getline < patterns_file) 
    patterns_array[$0] = 1
  close(patterns_file)
  RS="^>|\n>|\n$"
}
$1 in patterns_array { print ">" $0; delete patterns_array[$1] }
' sample[1-3].txt

Answer 1

提供されたソリューションを少し変更するとザイルズ存在するこれ質問（とも呼ばれる）jw013output.txt）、順序が入力シーケンスに基づいており、質問に記載されている順序とは異なることを除いて、要求された効果を得ることができます。

awk -v patterns_file=list.txt '
BEGIN {
  while (getline < patterns_file)
    patterns_array[">" $0] = 1
  close(patterns_file)
}
$0 in patterns_array { print; getline; print }
' sample[1-3].txt

出力：

>GETID_17049_knownids_1/2_Confidence_0.625_Length_2532
sampletextforsample1
>GETID_11084_knownids_3/3_Confidence_0.600_Length_1451
sampletextforsample2
>GETID_17049_knownids_1/2_Confidence_0.625_Length_2532
sampletextforsample3
>GETID_15916_knownids_10/11_Confidence_0.324_Length_1825
sample2textforsample3

編集する

複数行のレコードが機能するようにするには、適切なレコード区切り文字（RS）を使用します。あなたの場合は、greater-thanファイルの先頭（^>）またはnew-line後ろgreater-than（\n>）またはnew-lineファイルの終わり（\n$）に設定するのが良いオプションです。提供された入力について。

次のように動作する必要があります。

awk -v patterns_file=patterns.txt '
BEGIN {
  while (getline < patterns_file) 
    patterns_array[$0] = 1
  close(patterns_file)
  RS="^>|\n>|\n$"
}
$1 in patterns_array { print ">" $0 }
' sample[1-3].txt

編集2

各レコードを一度だけ出力するには、patterns_array後の出力からそのレコードを削除します。

awk -v patterns_file=patterns.txt '
BEGIN {
  while (getline < patterns_file) 
    patterns_array[$0] = 1
  close(patterns_file)
  RS="^>|\n>|\n$"
}
$1 in patterns_array { print ">" $0; delete patterns_array[$1] }
' sample[1-3].txt

一致リストからデータを取得する

ベストアンサー1

編集する

編集2

おすすめ記事