探したいNテキストファイルで最も一般的な単語ですが、次の条件があります。
cat
ファイルを入手してください。grep .
言葉を入手してください。tr -d '/r'
新しい行を削除します。
私はコードの後半に取り組むことができました|sort | uniq -c | sort -nr| head -10
。
ベストアンサー1
を使うと言われましたがgrep
、最も一般的な単語を探すことが目標なら必ずしも必要だとは思いません。おそらくテキストファイルを単語に分割してから | sort | uniq -c | sort -nr | head -10
パイプラインを実行したいと思うかもしれません。
すぐに思い付く解決策(そして間違いなく多くの選択肢があります)は、次のように正規表現を使用することですsed
。
sed 's/\s/\n/g'
\s
これは、単にすべての空白文字()を単一の改行文字()に置き換えることを意味します\n
。組み合わせると、あなたのソリューションは次のようになります。
cat [file] | sed 's/\s/\n/g' | sort | uniq -c | sort -nr | head -10 | awk '{print $2}'
awk '{print $2}'
(数字の代わりに)単語だけを表示するために最後に追加しましたが、これはすべてスクリプトの目的によって異なります。