AWK：2つのキー列がファイル間で一致する場合は、一致しない行を維持しながら、あるファイルの列16を別のファイルの一致する行に追加します。

Question

awkスクリプトは良いスタートですが、かなりマイナーな問題を解決する必要があります。

OFS同様に、出力フィールド区切り記号（）をタブに設定する必要がありますFS。
新しい列ヘッダーを印刷する必要があります。
一致する行でa[$2,$3]はなく印刷する必要があります。a[$16]
一致しない行を維持するには、その行も印刷する必要があり、すべての出力行が同じ数の列を持つように空のフィールドを追加することをお勧めします。

たとえば、

$ awk -F "\t" -v OFS='\t' '
  NR == FNR { a[$1,$2] = $5; next };

  FNR == 1     { c = "column 16" };
  ($2,$3) in a { c = a[$2,$3] };

  {
    print $0, c;
    c = ""
  }' FileB.tsv  FileA.tsv 
id      graph   circle  several columns...      length  column 16
196-0   196     0       ----    12874   TTCTAAAGTATAAAGCCTGTC...
195-1   195     1       ----    12874   CTTGCTTGAGCTGCTCTGCAA...
56-0    56      0       ----    3349
115-1   115     1       ----    5297

a[$1,$2]=$5FileBサンプルデータには5つのフィールドしかないので、ここではこれを使用しています。$16実際のデータに変更してください。

これは変数を使用して追加cする列の値を保持します。これには、新しい列名、空の文字列、または一致する行の列に追加される値が含まれます。各出力行が印刷された後、空の文字列にリセットされます。

cat -T参考までに、空のフィールドは一般的には見えませんが、出力をパイピングして、一致しない行に空のフィールドが追加されていることを確認できます。^Iその行の末尾に(タブ)が表示されます.

ハードコードではなく、FileB.tsvの最初の行から列名を取得する代替バージョン：

$ awk -F "\t" -v OFS='\t' '
  NR == 1      { c = $5 ; next };
  NR == FNR    { a[$1,$2] = $5; next };
  ($2,$3) in a { c = a[$2,$3] };

  { print $0, c; c = "" }' FileB.tsv  FileA.tsv

Answer 1

awkスクリプトは良いスタートですが、かなりマイナーな問題を解決する必要があります。

OFS同様に、出力フィールド区切り記号（）をタブに設定する必要がありますFS。
新しい列ヘッダーを印刷する必要があります。
一致する行でa[$2,$3]はなく印刷する必要があります。a[$16]
一致しない行を維持するには、その行も印刷する必要があり、すべての出力行が同じ数の列を持つように空のフィールドを追加することをお勧めします。