端末を使用し、cat "grep"を使用してtxtファイルで最も一般的なn個の単語を見つけます。およびtr -d "/r"コマンド

Question

を使うと言われましたがgrep、最も一般的な単語を探すことが目標なら必ずしも必要だとは思いません。おそらくテキストファイルを単語に分割してから | sort | uniq -c | sort -nr | head -10パイプラインを実行したいと思うかもしれません。

すぐに思い付く解決策（そして間違いなく多くの選択肢があります）は、次のように正規表現を使用することですsed。

sed 's/\s/\n/g'

\sこれは、単にすべての空白文字（）を単一の改行文字（）に置き換えることを意味します\n。組み合わせると、あなたのソリューションは次のようになります。

cat [file] | sed 's/\s/\n/g' | sort | uniq -c | sort -nr | head -10 | awk '{print $2}'

awk '{print $2}'（数字の代わりに）単語だけを表示するために最後に追加しましたが、これはすべてスクリプトの目的によって異なります。

Answer 1

を使うと言われましたがgrep、最も一般的な単語を探すことが目標なら必ずしも必要だとは思いません。おそらくテキストファイルを単語に分割してから | sort | uniq -c | sort -nr | head -10パイプラインを実行したいと思うかもしれません。

すぐに思い付く解決策（そして間違いなく多くの選択肢があります）は、次のように正規表現を使用することですsed。

sed 's/\s/\n/g'

\sこれは、単にすべての空白文字（）を単一の改行文字（）に置き換えることを意味します\n。組み合わせると、あなたのソリューションは次のようになります。

cat [file] | sed 's/\s/\n/g' | sort | uniq -c | sort -nr | head -10 | awk '{print $2}'

awk '{print $2}'（数字の代わりに）単語だけを表示するために最後に追加しましたが、これはすべてスクリプトの目的によって異なります。

おすすめ記事