bash で列内の一意の値の数を取得する質問する

2024-07-04 • tag-icon

bash command-line frequency

複数の列を持つタブ区切りのファイルがあります。フォルダー内のすべてのファイルについて、列内の異なる値の出現頻度をカウントし、カウントの降順 (最も高いカウントが最初) で並べ替えたいと考えています。Linux のコマンドライン環境でこれを実現するにはどうすればよいでしょうか。

awk、perl、python などの一般的なコマンドライン言語を使用できます。

列 2 の頻度カウントを表示するには (例):

awk -F '\t' '{print $2}' * | sort | uniq -c | sort -nr

ファイルA.txt

z    z    a
a    b    c
w    d    e

ファイルB.txt

t    r    e
z    d    a
a    g    c

ファイルC.txt

z    r    a
v    d    c
a    m    c

結果：

おすすめ記事