私はコンピューティングクラスタ(シングルノード)で実行される膜をシミュレートするためのコードを書いています。このコンピュータのコードを最適化したいと思います。私は-optimize、-O3、および-march = core2を使用しました。
行軍係数を増やすことができるのか、それを改善するためにできる他の措置があるのか、どうすればわかりますか?
ありがとう
ベストアンサー1
使用-mtune
。-march
許可されているコマンドセットを決定し、コードのパフォーマンス-mtune
を調整するために使用されます(いつものように参考資料を参照man gcc
)。特定のCPUタイプによって異なる値を考慮することもできますcore2
。最新のGCCバージョンを使用している場合は、これを使用する方が良いでしょう(少なくとも4.4
私の考えでは)。native