単語リストファイルで単語数を数えるときに発生順序を維持する方法

Question

すべてのUnixシステムのすべてのシェルでPOSIX awkを使用してください。

$ cat tst.awk
BEGIN { OFS="\t" }
NR==FNR {
    words[NR] = $1
    next
}
{
    $0 = " " $0 " "
    gsub(/[^[:alpha:]]+/,"  ")
    for ( i in words ) {
        word = words[i]
        cnts[word] += gsub(" "word" ","&")
    }
}
END {
    for ( i=1; i in words; i++ ) {
        word = words[i]
        print word, cnts[word]+0
    }
}

$ awk -f tst.awk file1 file2
dog     1
apple   1
cat     2

上記では、「単語」がすべてアルファベット文字で、一致が大文字と小文字を区別したい場合、または例のように入力がすべて小文字で、例のようにfile1の単語が一意であると仮定します。

Answer 1

すべてのUnixシステムのすべてのシェルでPOSIX awkを使用してください。

$ cat tst.awk
BEGIN { OFS="\t" }
NR==FNR {
    words[NR] = $1
    next
}
{
    $0 = " " $0 " "
    gsub(/[^[:alpha:]]+/,"  ")
    for ( i in words ) {
        word = words[i]
        cnts[word] += gsub(" "word" ","&")
    }
}
END {
    for ( i=1; i in words; i++ ) {
        word = words[i]
        print word, cnts[word]+0
    }
}

$ awk -f tst.awk file1 file2
dog     1
apple   1
cat     2

上記では、「単語」がすべてアルファベット文字で、一致が大文字と小文字を区別したい場合、または例のように入力がすべて小文字で、例のようにfile1の単語が一意であると仮定します。

単語リストファイルで単語数を数えるときに発生順序を維持する方法

ベストアンサー1

おすすめ記事