このような文書があります。
1 0.2
1 0.3
1 0.1
2 0.8
2 0.5
2 0.3
最初の列が同じ場合は、行を追加して次のように出力したいと思います。
1 0.6
2 1.6
awkを使ってこれを行うにはどうすればよいですか?それとも、他のツールを使用する方が簡単ですか?
PD:3行ごとに最初の列は常に同じなので、配列を作成し、行数が3になるまで$ 2を追加して印刷しますか?しかし、いくつかawk 'BEGIN {x=0,n=1} {n++,x=x+$3}'
の条件がありますか?
ベストアンサー1
「最初の値、2番目の値の合計」配列を作成し、ファイル全体を読み取った後に結果を印刷できます。
awk '{a[$1]+=$2} END { for (v in a) { print v,a[v]}}' datafile
出力をソートする最も簡単な方法は、ソートを介して出力をパイプすることです。
awk '{a[$1]+=$2} END { for (v in a) { print v,a[v]}}' datafile | sort -n