最初の列に基づいて2つのファイルを比較します。一致する場合は行を保持[閉じる]

Question

最初のファイルの最初の列が2番目のファイルの列に対応するすべての行を抽出しようとしています。

最初のファイルの最初の列にはテキストのみが含まれているようです（残りは数字です）、単にgrepそれを使用できます。

bashプロセス置換を理解する他のシェルでは、これは問題になる可能性があります。

grep -F -f <( awk -F, 'NR > 1 { print $1 }' <file2 ) file1 >newfile

他のシェルでは、まずコマンド出力を一時awkファイルに書き込み、それをgrep -f.

awk次のような出力を生成します。

p10_1003_length_529_cov_12.940299
p10_1021_length_525_cov_6.801508
p10_1047_length_521_cov_4.852792
p10_1152_length_501_cov_22.430481
p10_139_length_1152_cov_892.463415
p10_149_length_1130_cov_7.540379

grep最初のファイルのすべての行に一致させるために、これを固定文字列パターンとして使用します。

awkまず、2番目のファイルの最初の列を連想配列のキーとして読み、次にそのキーに対して最初のファイルの最初の列をテストすることを含むすべての操作を実行できます。

awk -F, 'NR==FNR && FNR>1 { keys[sprintf("\"%s\"", $1)] }
         NR!=FNR && FNR>1 && ($1 in keys)' file2 file1

変ですsprintf()。最初の列がfile1二重引用符で囲まれているためです。で読み取ったデータに二重引用符を追加するだけですfile2。

から始めたらFNR>1。NR==FNRfile2

Answer 1