1行の平均単語数を計算する方法は？ [閉鎖]

Question

wc file与えられた数の行、単語、バイトが表示されますfile。単語対行の比率は、行当たりの平均単語数を提供する。

一意の単語数を計算するには、ファイルを1行に1つの単語（ここでは1つ以上のスペースで区切られた項目）に分割してソートし、一意の単語数を数えます。

tr -s ' ' '\n' < file | sort -u | wc -l

句読点を削除する必要がある場合は、並べ替える前に結果をフィルタリングする必要があります（例えば不要な文字を削除するためtr）。

2つのファイルの一意の単語数を数えるには、次のようにしますcomm。

comm -3 <(tr -s ' ' '\n' < file1 | sort -u) <(tr -s ' ' '\n' < file2 | sort -u)

file1file2または両方には、発生せずにのみ発生する単語が一覧表示されます。

comm -12 <(tr -s ' ' '\n' < file1 | sort -u) <(tr -s ' ' '\n' < file2 | sort -u)

両方のファイルに表示される単語をリストし、wc -lパイプで計算します。

複数のファイルの一意の単語数を数えるには、次に供給する前に接続してくださいtr。

cat file1 file2 | tr -s ' ' '\n' | sort -u | wc -l

Answer 1