各テキストのインスタンス数を見つける方法は? [コピー]

各テキストのインスタンス数を見つける方法は? [コピー]

したがって、都市で構成された列を含む大きなファイルがあります。各都市のインスタンスの総数を見つけ、新しいファイルに表示するプログラムを作成したいと思います。どうすればいいですか?

これは例であり、これ以上の値があります

ファイルが次のような場合

City           
Manhattan   
Cork       
Manhattan  
Chennai
Chennai

出力はどのように見えるべきですか?

City
Manhattan 2 
Cork      1
Chennai   2

ベストアンサー1

以下を使用してくださいdatamash

datamash -g1 -s -H count 1 < infile

出力:

GroupBy(City)   count(City)
Chennai 2
Cork    1
Manhattan   2

おすすめ記事