次のファイルがあります。
Id Chr Start End
Prom_1 chr1 3978952 3978953
Prom_1 chr1 3979165 3979166
Prom_1 chr1 3979192 3979193
Prom_2 chr1 4379047 4379048
Prom_2 chr1 4379091 4379092
Prom_2 chr1 4379345 4379346
Prom_2 chr1 4379621 4379622
Prom_3 chr1 5184469 5184470
Prom_3 chr1 5184495 5184496
同じ識別子が何回表示されるかを計算したいと思います。それは次のとおりです。
Prom_1 3
Prom_2 4
Prom_3 2
どんなアイデアにも感謝します。
ベストアンサー1
そしてGNUデータの混合
$ datamash -W --header-in groupby 1 count 2 < file
Prom_1 3
Prom_2 4
Prom_3 2