コンパイラのみのメモリバリア（std::atomic_signal_fenceなど）はいつ役立つのでしょうか？質問する

Question

5つの質問すべてに答えるには:

1) コンパイラフェンス（CPUフェンスなしで単独で）は、二状況:

実施するためにメモリ順序制約 単一スレッドと非同期割り込みハンドラの間同じスレッド (シグナルハンドラーなど) にバインドされます。
実施するためにメモリ順序制約 すべてのスレッドが同じCPUコア上で実行されることが保証されている複数のスレッド間つまり、アプリケーションはシングルコアシステム、またはアプリケーションが特別な措置を講じる（プロセッサの親和性) により、データを共有するすべてのスレッドが同じコアにバインドされるようになります。

2) 基盤となるアーキテクチャのメモリモデルは、それが強い順序付けであるか弱い順序付けであるかに関係なく、状況でコンパイラフェンスが必要かどうかには影響しません。

3) ここは疑似コードこれは、コンパイラフェンスを単独で使用して、スレッドと同じスレッドにバインドされた非同期シグナルハンドラー間のメモリアクセスを十分に同期する方法を示しています。

void async_signal_handler()
{
    if ( is_shared_data_initialized )
    {
        compiler_only_memory_barrier(memory_order::acquire);
        ... use shared_data ...
    }
}

void main()
{
// initialize shared_data ...
    shared_data->foo = ...
    shared_data->bar = ...
    shared_data->baz = ...
// shared_data is now fully initialized and ready to use
    compiler_only_memory_barrier(memory_order::release);
    is_shared_data_initialized = true;
}

重要な注意点：この例では、が初期化してフラグを設定するasync_signal_handler同じスレッドにバインドされていると想定しています。つまり、アプリケーションはシングルスレッドであるか、それに応じてスレッドシグナルマスクを設定します。そうでない場合、コンパイラフェンスは不十分であり、shared_datais_initializedCPUフェンスも必要になるでしょう。

4)それらは同じであるはずです。 acq_relどちらもseq_cst完全な (双方向の) コンパイラフェンスとなり、フェンス関連の CPU 命令は発行されません。「シーケンシャルコンシステンシ」の概念は、複数のコアとスレッドが関係する場合にのみ適用され、atomic_signal_fence実行の 1 つのスレッドにのみ適用されます。

5)いいえ。（もちろん、スレッドローカルデータが非同期シグナルハンドラからアクセスされる場合は、コンパイラフェンスが必要になるかもしれません。）それ以外の場合、コンパイラ（およびCPU）は、そのスレッドローカルデータに関してプログラムの観察可能な動作を変更しない方法でのみメモリアクセスを並べ替えることができるため、フェンスはスレッドローカルデータでは必要ありません。シーケンスポイントシングルスレッドの観点からは、マルチスレッドプログラムのスレッドローカルスタティックは、シングルスレッドプログラムのグローバルスタティックと同じであると論理的に考えることができます。どちらの場合も、データは単一のスレッドからのみアクセス可能であり、データ競合の発生を防ぎます。

Answer 1