ファイルで最も一般的な文字/文字の組み合わせを見つける

Question

繰り返しモノグラム文字列をすべてリストする必要があります...

...それで、スクリプトから1文字から全行の長さ（サンプルデータが1行に1単語を提供するため、単語の長さ）までの可能なすべての長さを調べました。

文書ssf.mawk:

#!/usr/bin/mawk -f
BEGIN {
        FS=""
}
{
        _=tolower($0)
        for(i=1;i<=NF;i++)
                for(j=i;j<=NF;j++)
                        print substr(_,i,j-i+1) | "sort|uniq -c|sort -n"
}

サンプル入力を使用して実行出力を低減します。

$ printf '%s\n' Stack Exchange Internet Web Question Find Frequent Words Combination Letters .... | ./ssf.mawk
      1 ....
      1 ac
      1 ack
      1 an
      1 ang

(((ここでは多くの行が省略されています)))

mawk-1.3.3私はこれをDebian8でテストしましたgawk-4.1.1。

Answer 1

繰り返しモノグラム文字列をすべてリストする必要があります...

...それで、スクリプトから1文字から全行の長さ（サンプルデータが1行に1単語を提供するため、単語の長さ）までの可能なすべての長さを調べました。

文書ssf.mawk:

#!/usr/bin/mawk -f
BEGIN {
        FS=""
}
{
        _=tolower($0)
        for(i=1;i<=NF;i++)
                for(j=i;j<=NF;j++)
                        print substr(_,i,j-i+1) | "sort|uniq -c|sort -n"
}

サンプル入力を使用して実行出力を低減します。

$ printf '%s\n' Stack Exchange Internet Web Question Find Frequent Words Combination Letters .... | ./ssf.mawk
      1 ....
      1 ac
      1 ack
      1 an
      1 ang

(((ここでは多くの行が省略されています)))

mawk-1.3.3私はこれをDebian8でテストしましたgawk-4.1.1。

ファイルで最も一般的な文字/文字の組み合わせを見つける

ベストアンサー1

おすすめ記事