ファイル内の単語の発生率を見つける方法

ファイル内の単語の発生率を見つける方法

単語があり、ファイルにその単語の数パーセントが表示されることを確認したい(ファイル内の単語の総数に基づいて)。たとえば、「you」という単語が8つの単語を含むファイルに2回表示されると、出力は25%になります。

私は試した: fgrep -ow

ベストアンサー1

次のようにファイルの総単語数を取得できます。

nw=`wc -w < /path/to/file`

ワード/パターンの発生回数

occurrences=`egrep -c <pattern> /path/to/file`

その後、パーセンテージを簡単に計算し、結果を変数に入れることができます。

result=`echo "scale=2; $occurrences*100/$nw" | bc`

追加するには、たとえば、%次のようにします。次のようにしてください

echo $result'%'

おすすめ記事