Linux上のファイル内の2つの異なる単語の発生回数を把握する方法は?

Linux上のファイル内の2つの異なる単語の発生回数を把握する方法は?

Linux上のファイル内の2つの異なる単語(「register」や「evn」など)の発生回数を把握するには?

出力は次のようになります。

registered:20

ベストアンサー1

リバース出力形式(最初に計算し、単語は後で入力)も許可され、より多くの単語を追加するのが簡単な場合にも機能します。

tr -c '[:alpha:]' '\n' < /path/to/file | sort | uniq -c | grep -w 'register\|evn'
  • 同じ行に複数回現れる場合でも、各単語の発生回数を計算します。
  • サフィックスバリアントを除いて、単語に正確に一致する項目を計算します。

おすすめ記事