csvファイルのすべての列で一意の値を計算する

csvファイルのすべての列で一意の値を計算する

15000行と16列のCSVファイルa.csvがあります。別の列に数字、文、日付があります。

次のようになります。

A, B, C, D
a  b  c  d
e  f  g  h
e  i  j  k
a  m  n  k

各列の固有値を個別に計算してすぐに印刷するにはどうすればよいですか?

私は次のような出力が欲しい。

A 2
B 4
C 4
D 3

どんなアドバイスや助けにも感謝します。よろしくお願いします。

ベストアンサー1

xsvを使用する(https://github.com/BurntSushi/xsv)から始める

A,B,C,D
a,b,c,d
e,f,g,h
e,i,j,k
a,m,n,k

そして走っている

xsv stats input.csv --everything | xsv select field,cardinality >output.txt

あなたはやる

field,cardinality
A,2
B,4
C,4
D,3

おすすめ記事