ファイル内のすべての一意のUnicode文字とその文字を表示するためのクイックツールはありますか?

ファイル内のすべての一意のUnicode文字とその文字を表示するためのクイックツールはありますか?

ファイル内のすべての固有のUnicode文字とその数を表にするツールを知っている人はいますか?

ベストアンサー1

「Unicode文字」が正確に何を意味するのかわかりません。ファイル内の一意の文字数を数えるには、次のようにします。

$ awk -v FS="" -v OFS="\t" '{for(i=1;i<=NF;i++) char[$i]++} END { for(i in char) print i,char[i]}' input.txt

-v FS=""フィールド区切り文字をスペースに設定します。したがって、各文字は単一のフィールドとして扱われます。各行の文字をリストのキーとして使用してフィールドを繰り返し、増分単位で計算します++。すべての行を読むと、数のリストを繰り返し、各キー(文字を表す)とその数を印刷します。

おすすめ記事