したがって、都市で構成された列を含む大きなファイルがあります。各都市のインスタンスの総数を見つけ、新しいファイルに表示するプログラムを作成したいと思います。どうすればいいですか?
これは例であり、これ以上の値があります
ファイルが次のような場合
City
Manhattan
Cork
Manhattan
Chennai
Chennai
出力はどのように見えるべきですか?
City
Manhattan 2
Cork 1
Chennai 2
ベストアンサー1
以下を使用してくださいdatamash
。
datamash -g1 -s -H count 1 < infile
出力:
GroupBy(City) count(City)
Chennai 2
Cork 1
Manhattan 2