ファイル間の主列がすべて一致し、これらの主列が一致した場合は、出力ファイルに補助列を貼り付けます。

Question

次のファイルを生成します。

merge21:

開始{
        IFS="\t"
        OFS = "\t"
}
NR==FNR { #ファイル2
        キー=$2","$3
        存在[キー] = 1
        小さな8[キー] =1
        Next
}
{#ファイル1
        キー=$1 "," $3
        if (現在[キー]) $1, $2, $3, $4,マイナー8 [キー]
}

merge312:

開始{
        IFS="\t"
        OFS = "\t"
}
NR==FNR { #ファイル3
        キー=$1","$2
        存在[キー] = 1
        小さな9[キー] =$3
        Next
}
{#ファイル1 +ファイル2
        キー=$1 "," $3
        if (現在[キー]) $1, $2, $3, $4,$5、未成年者9 [鍵]
}

それらはほぼ同じです。違いを太字にしました。ここでコマンドを入力してください。

awk -f merge21 file2 file1 | awk -f merge312 file3 -

これはデータにカンマが含まれていないと仮定しますが、実際には存在するかどうかによって異なります。一部データに表示されない文字列です。より多くの列をサポートするためにこれを拡張することは容易ではありません。これできる一度にすべてのタスクを実行するように改善できますが、awkこれはもう少し複雑で（IMNSHO）努力する価値はありません。

これはファイル内のデータの「内部結合」を生成します。INNER接続とOUTER接続の違いいくつかの定義については、スタックオーバーフローを確認してください。これを「左外部結合」に変更したい場合は許可されます^{_{（そしてわいせつ投票）}} この質問に対する答えは、「最初のテーブルのすべての行と他のテーブルの共通行」と解釈されます。最後のドアをmerge21次に

        if (present[key]) print $1, $2, $3, $4, minor8[key]
        else              print $1, $2, $3, $4, "-"

また、 ""行と""行をmerge312削除したと仮定すると、出力は次のようになります。1 cfile24 ffile4

MAIN1   minor1  MAIN2   minor3  minor8  minor9
1       bla1    a       blabla1 yes6    sure3
1       bla2    b       blabla2 yes7    sure4
1       bla3    c       blabla3 -       sure5
2       bla4    a       blabla4 yes9    sure6
2       bla5    d       blabla5 yes1    sure7
3       bla6    e       blabla6 yes2    sure8
4       bla7    f       blabla7 yes3    -
5       bla8    a       blabla8 yes4    sure1
5       bla9    g       blabla9 yes5    sure2

そして当然削除することもできます。-文字対sed（もちろん、実際のデータに実際にハイフンが含まれている場合は、欠落しているデータのプレースホルダとして使用されていない文字または文字列を選択してください。）

Answer 1