最初のカンマの前の一致に基づいて重複行を検索する

2024-06-29 • tag-icon

linux text-processing awk sed

次のデータで最初のカンマの前の数字に基づいて重複行を見つける方法は？

入力する：

112112112,00,00,00
110110,01,01,02
112112112,11,11,888
110110,99,88,8
410410,22,22,22

出力：

112112112 (2)
110110    (2)

修正できますが、スチールドライバーソリューション以前の同様の質問に対する迅速で汚れたパイプラインは次のとおりです。

cut -d, -f1 < input | sort | uniq -c | awk '$1 > 1 { print $2, "(" $1 ")" }'

おすすめ記事