別のファイルによって提供される単語のリストに基づいて、大容量ファイルの単語数を計算しようとしています。
grep -F -f matchingwords.txt bigfile.txt
働くただし、各単語の数を数える必要がありますmatchingwords.txt
。
試しましたが、grep -o -f matchingwords.txt bigfile.txt
「無効な正規表現」エラーが発生しました。
while read line; do grep -o "$line" bigfile.txt; done < matchingwords.txt > output.txt
しかし、上からカウントを取得する方法がわかりません。
ベストアンサー1
-o
試してみました-F
か?何か間違った正規表現として解釈されるようですがmatchingwords.txt
…正規表現を使用する意図ではないようです。
したがって、見つけたとし、各単語一致の発生回数を計算する方法は次のとおりです。
grep -F -o -f matchingwords.txt bigfile.txt | sort | uniq --count
次のような結果が得られます。
5 apple
12 banana
9 orange