awkを介して複数のファイルをN個の共通列にマージします。ファイルに共通キーがない場合は、列の値をゼロに変更したいと思います。

Question

awkを使用し、出力でレコードの順序を維持します。

awk 'BEGIN{ SUBSEP=OFS=FS="," }
 FNR==1 && !reProccss{ fileNr++ }
 !reProccss{ keys[$1, $2, $3, fileNr]=$4; next }
  reProccss{ key=($1 OFS $2 OFS $3); recNr++
             for(i=1; i<=fileNr; i++)
                 if(seen[key]++<fileNr){
                     join[key]= join[key] OFS ((key, i) in keys ?keys[key, i]:"0")
                     data[recNr]= key join[key]
                 }
           }
END{ for(rec=1; rec<=recNr; rec++)
         if(data[rec]!="")
             print data[rec]
}' a[1-3].txt reProccss=1 a[1-3].txt

または、join+シェルを使用して複数の列をキーで単一のキーに変換し、次のようjoinな答えでコマンドを使用します。最初の列に複数のファイルをマージする（結合は単一の列をキーとして使用しなければ機能しないため）、目的の出力を生成します。

-そのため、最初の2つのファイルの特定の文字（入力ファイルに含まれてはいけない文字など）で区切って、複数のキー列を1つのキー列に変換して一時ファイルに出力します。joined.tmp:

join -t, -a1 -a2 -e 0 -o auto \
    <(<a1.txt sort |awk -F, -v OFS='-' '{ print $1, $2, $3 FS $4 }') \
    <(<a2.txt sort |awk -F, -v OFS='-' '{ print $1, $2, $3 FS $4 }') > joined.tmp

次に、シェルループを使用して残りのファイルを処理します。joined.tmpファイル（次のファイルに関連付けるために実行されるたびに更新されます）、ループですでに処理されている最初の2つのファイルもスキップされます。

for file in ./a*.txt; do
    [ "$file" = "./a1.txt" -o "$file" = "./a2.txt" ] && continue
    join -t, -a1 -a2 -e 0 -o auto \
        joined.tmp <(sort "$file" |awk -F, -v OFS='-' '{ print $1, $2, $3 FS $4 }') >joined.tmp.1
    mv joined.tmp.1 joined.tmp
done

最後に追加された文字を-元の文字に戻します,。

sed 's/-/,/g' joined.tmp > joined-final.csv

join入力ファイルをソートする必要があるため、出力のレコードの順序が変わります。

$ cat joined-final.csv
111,222,444,5.5,7.8,0
121,321,555,1.2,0,0
311,555,222,0,1.1,8.8
333,321,555,0,4.5,9.1
444,666,777,0,0,2.5

Answer 1