同じ識別子から正確な数の要素を抽出する

同じ識別子から正確な数の要素を抽出する

次のファイルがあります。

Id       Chr     Start   End    
Prom_1   chr1    3978952 3978953  
Prom_1   chr1    3979165 3979166  
Prom_1   chr1    3979192 3979193  
Prom_2   chr1    4379047 4379048  
Prom_2   chr1    4379091 4379092  
Prom_2   chr1    4379345 4379346  
Prom_2   chr1    4379621 4379622  
Prom_3   chr1    5184469 5184470  
Prom_3   chr1    5184495 5184496  

同じ識別子が何回表示されるかを計算したいと思います。それは次のとおりです。

Prom_1  3  
Prom_2  4  
Prom_3  2  

どんなアイデアにも感謝します。

ベストアンサー1

そしてGNUデータの混合

$ datamash -W --header-in groupby 1 count 2 < file
Prom_1  3
Prom_2  4
Prom_3  2

おすすめ記事