一部の列データの固有値と重複値の数を印刷する最も簡単なコマンド

2024-06-24 • tag-icon

text-processing awk

3列、1列目、3列目のサンプル入力データには重複値があるため、重複回数と一意に印刷する必要があります。

sort -uはある意味では役に立ちますが、最初と3番目の列に関連する重複値の発生を印刷しません。

Input :

3210 -06:00
5172 -06:00
3335 -07:00
3258 -05:00
B3322 -05:00
B5097 -05:00
ㄷ3238 -06:00
ㄷ5364 -05:00
ㄷ 3366 -06:00
ㄷ 3293 -06:00

出力：

A(2)-06:00
A(1)-07:00
仕事(1)-05:00
B(2)-05:00
中（3）-06:00
中（1）-05:00

または

出力：

ああ2 -06:00
ああ1 -07:00
ああ1 -05:00
地下2階 -05:00
すべて3 -06:00
中 1 -05:00

正確に望む形式ではありませんが、他のすべての要件を満たしています。

awk '{print $1" "$3}' <inFile> | sort | uniq -c

英語では、awkを使用して最初と3番目の列のみを印刷してソートし、uniqにcountを使用します。

おすすめ記事