テキストファイル内のすべての単語とその発生回数を個別に計算したいと思います。

テキストファイル内のすべての単語とその発生回数を個別に計算したいと思います。

file.txt次の内容を含むファイルがあります。

I am groot, groot me, me groot,I love groot, groot groot, am I groot groot so

すべての単語を個別に計算したい。

単語の世紀には、次のコマンドを使用します。

tr ' ' '\n' < file.txt | grep "groot" | wc -l

しかし、すべての単語を数える方法があるかどうかを知りたいです。希望の出力は次のとおりです。

word        count
I           4
am          3
groot       8
me          2

bashファイルまたはbashスクリプトを使用して実行できますか?助けてください。

ベストアンサー1

grep -o '\w\+' file.txt | sort | uniq -c

説明する:

  • grep -o各一致は別々の行に出力されます。
  • \w\+連続した英数字と一致します_
  • uniq -c各連続実行ごとに繰り返される行の発生回数が出力される。
  • 各固有単語を1つの連続した反復行にグループ化するには、sortbeforeが必要です。uniq -c

おすすめ記事