ディレクトリ内の各ファイルについて最も一般的な単語を見つける方法は？

Question

一致のみを印刷する文字列の一番上の単語を抽出するには、grepwithを使用します。-o

$ for file in *; do 
    printf '%s : %s\n' "$(grep -Eo '[[:alnum:]]+' "$file" | sort | uniq -c | 
        sort -rn | head -n1)" "$file" 
done
      8 no : file1
     10 so : file2
     12 in : file3

または、grepこれをサポートしていない場合は、すべてのスペースと句読点をに置き換えて、フィルタを使用して空白行をスキップして次のように計算-oできます。tr\ngrep .

$ for file in *; do 
    printf '%s : %s\n' "$(tr '[[:punct:]][[:space:]]' '\n' < "$file" | grep . | 
      sort | uniq -c | sort -rn | head -n1)" "$file" 
done
  8 no : file1
 10 so : file2
 12 in : file3

Answer 1

一致のみを印刷する文字列の一番上の単語を抽出するには、grepwithを使用します。-o

$ for file in *; do 
    printf '%s : %s\n' "$(grep -Eo '[[:alnum:]]+' "$file" | sort | uniq -c | 
        sort -rn | head -n1)" "$file" 
done
      8 no : file1
     10 so : file2
     12 in : file3

または、grepこれをサポートしていない場合は、すべてのスペースと句読点をに置き換えて、フィルタを使用して空白行をスキップして次のように計算-oできます。tr\ngrep .

$ for file in *; do 
    printf '%s : %s\n' "$(tr '[[:punct:]][[:space:]]' '\n' < "$file" | grep . | 
      sort | uniq -c | sort -rn | head -n1)" "$file" 
done
  8 no : file1
 10 so : file2
 12 in : file3

ディレクトリ内の各ファイルについて最も一般的な単語を見つける方法は？

ベストアンサー1

おすすめ記事