次のデータで最初のカンマの前の数字に基づいて重複行を見つける方法は?
入力する:
112112112,00,00,00
110110,01,01,02
112112112,11,11,888
110110,99,88,8
410410,22,22,22
出力:
112112112 (2)
110110 (2)
ベストアンサー1
修正できますが、スチールドライバーソリューション以前の同様の質問に対する迅速で汚れたパイプラインは次のとおりです。
cut -d, -f1 < input | sort | uniq -c | awk '$1 > 1 { print $2, "(" $1 ")" }'