一致するフィールドに基づいて列の合計

Question

私はPerlでこれをします：

$ perl -lane '$k{"$F[0] $F[1]"}+=$F[2]+$F[3]; 
              END{print "$_ $k{$_}" for keys(%k) }' file 
2 1019 15
2 1021 4
2 1030 6
2 1031 8
2 1022 9

またはちょっと：

awk '{a[$1" "$2]+=$3+$4}END{for (i in a){print i,a[i]}}' file

2番目の列に基づいて出力を並べ替えるには、次のようにパイプできますsort。

awk '{a[$1" "$2]+=$3+$4}END{for (i in a){print i,a[i]}}' file | sort -k2

どちらのソリューションも最初の列を含みます。アイデアは、最初と2番目の列をハッシュ（perl）または関連配列（awk）のキーとして使用することです。各ソリューションの鍵は、2column1 column2行目の2列目が同じですが、1列目が異なる場合は別々にグループ化されることです。

$ cat file
2 1019 2 3
2 1019 4 1
3 1019 2 2

$ awk '{a[$1" "$2]+=$3+$4}END{for (i in a){print i,a[i]}}' file
3 1019 4
2 1019 10

Answer 1

私はPerlでこれをします：

$ perl -lane '$k{"$F[0] $F[1]"}+=$F[2]+$F[3]; 
              END{print "$_ $k{$_}" for keys(%k) }' file 
2 1019 15
2 1021 4
2 1030 6
2 1031 8
2 1022 9

またはちょっと：

awk '{a[$1" "$2]+=$3+$4}END{for (i in a){print i,a[i]}}' file

2番目の列に基づいて出力を並べ替えるには、次のようにパイプできますsort。

awk '{a[$1" "$2]+=$3+$4}END{for (i in a){print i,a[i]}}' file | sort -k2

どちらのソリューションも最初の列を含みます。アイデアは、最初と2番目の列をハッシュ（perl）または関連配列（awk）のキーとして使用することです。各ソリューションの鍵は、2column1 column2行目の2列目が同じですが、1列目が異なる場合は別々にグループ化されることです。

$ cat file
2 1019 2 3
2 1019 4 1
3 1019 2 2

$ awk '{a[$1" "$2]+=$3+$4}END{for (i in a){print i,a[i]}}' file
3 1019 4
2 1019 10

一致するフィールドに基づいて列の合計

ベストアンサー1

おすすめ記事