ファイル内のすべての文字列の発生回数を計算し、各文字列の平均値を取得する方法

Question

使用先csvsql：csvkit

ファイルがスペースで区切られた場合：

csvsql -d' ' -S -H --query 'select a as Name, count(*) as count, avg(b) as Average from file group by a' file \
    | csvformat -D' '

または、ファイルがタブ区切りの場合：

csvsql -t -S -H --query 'select a as Name, count(*) as count, avg(b) as Average from file group by a' file \
    | csvformat -T

出力：

Name    count   Average
NEUTRON 2   14.471691
PION+   2   0.7710725
PION-   3   7.74835266667

次のコマンドを使用してインストールする必要がありますpip。

pip install csvkit

Answer 1

使用先csvsql：csvkit

ファイルがスペースで区切られた場合：

csvsql -d' ' -S -H --query 'select a as Name, count(*) as count, avg(b) as Average from file group by a' file \
    | csvformat -D' '

または、ファイルがタブ区切りの場合：

csvsql -t -S -H --query 'select a as Name, count(*) as count, avg(b) as Average from file group by a' file \
    | csvformat -T

出力：

Name    count   Average
NEUTRON 2   14.471691
PION+   2   0.7710725
PION-   3   7.74835266667

次のコマンドを使用してインストールする必要がありますpip。

pip install csvkit

おすすめ記事