ファイル内の一意の単語とその数を取得したいと思います。次のコマンドを実行すると、
sort words.txt | uniq -c
2 america
4 and
1 england
1 file
1 for
1 place
しかし、次の形式で出力したいです。
america,2
and,4
england,1
file,1
for,1
place,1
私の入力ファイルは約30〜40 Gbです。それでは、この形式で出力を印刷する最良の方法は何ですか?
ベストアンサー1
awk
コマンドの最後に行を追加できます。例えば、
sort words.txt | uniq -c | awk '{print $2","$1}'
デフォルトでは、最初の列の前に2番目の列をカンマで区切って配置します。 30-40Gbファイルでこれを実行するのにどれくらいの費用がかかっているのかわかりません。