Bashで計算を実行する効率的な方法

Question

シェルではこれを行わないでください。どんなに調整しても効率よく作れません。シェルループは遅いシェルを使用してテキストを解析するのは悪い習慣です。スクリプト全体をawk次の簡単な1行に置き換えることができます。これははるかに高速です。

awk 'BEGIN{E = exp(1);} $1>0{tot+=log($1); c++} END{m=tot/c; printf "%.2f\n", E^m}' file

たとえば、1から100までの数字を含むファイルに対してこのコマンドを実行すると、次の結果が表示されます。

$ seq 100 > file
$ awk 'BEGIN{E = exp(1);} $1>0{tot+=log($1); c++} END{m=tot/c; printf "%.2f\n", E^m}' file
37.99

速度に関して、私は1から10000までの数字を含むファイルに対して上記で提供されたシェルソリューション、Pythonソリューション、およびawkをテストしました。

## Shell
$ time foo.sh
3677.54

real    1m0.720s
user    0m48.720s
sys     0m24.733s

### Python
$ time foo.py
The Geometric Mean is:  3680.827182220091

real    0m0.149s
user    0m0.121s
sys     0m0.027s


### Awk
$ time awk 'BEGIN{E = exp(1);} $1>0{tot+=log($1); c++} END{m=tot/c; printf "%.2f\n", E^m}' input.txt
3680.83

real    0m0.011s
user    0m0.010s
sys     0m0.001s

ご覧のとおり、awkPythonよりも高速で作成が簡単です。必要に応じてこれを「シェル」スクリプトにすることもできます。次のようになります。

#!/bin/awk -f

BEGIN{
    E = exp(1);
} 
$1>0{
    tot+=log($1);
    c++;
}
 
END{
    m=tot/c; printf "%.2f\n", E^m
}

または、シェルスクリプトにコマンドを保存します。

#!/bin/sh
awk 'BEGIN{E = exp(1);} $1>0{tot+=log($1); c++;} END{m=tot/c; printf "%.2f\n", E^m}' "$1"

Answer 1