カーネルがSSE / AVXレジスタと命令を使用できないのはなぜですか？

Question

〜のようにザイルズFPUが使用される場所ごとに、カーネルはステートフルと復元をサポートする必要があると述べました。ユーザースペースはFPUを使用できるため、いかなる場合でもコンテキスト切り替えで処理する必要があります（つまり、現在のCPUがあるスレッドから別のスレッドに切り替えられるとき） - 少なくとも以前に実行されているスレッドがFPUを使用している場合。それでは、これをカーネルに拡張してみてはいかがでしょうか？

カーネルでFPUを使用しない理由はいくつかあります。

移植性の観点から、一部のアーキテクチャはカーネルでFPUの使用をまったくサポートしていないため、汎用コードはFPUに依存できません。
FPUの状態を保存して復元するのに費用がかかり、特定の実装関連の制約が発生します（特にx86 Linuxではプリエンプションを慎重に検討する必要があります）。

カーネルがFPUを使用しないようにすることは、ユーザースペースのコストを削減することを意味します。 FPUの状態は、コンテキスト切り替え後にのみ復元できます。ユーザースペースに戻るとき（コンテキスト切り替え直後とは対照的に）すべての場合に適用されるわけではありません（関連スレッドが実際にFPUを使用している場合のみ）。

それはいただし、カーネルのx86固有のコードでFPU（およびMMX / SSE / AVX）を使用でき、利点はコストよりも大きくなります。したがって、最終的に暗号化コードとRAID6で使用されます。LinusからのEメール詳細を提供してください。 FPUを使用するには、kernel_fpu_beginすべてのFPUを間にコードで囲み、kernel_fpu_end障害が発生したり、スリープモードが発生していないことを確認する必要があります。バラよりarch/x86/include/asm/fpu/api.hそしてarch/x86/kernel/fpu/core.cもっと学ぶ。

の場合、memcpyパフォーマンスの向上はFPUの使用コストを超えません。

（x86はかなり複雑なFPUアーキテクチャを持っていますが、オペレーティングシステムがFPUを共有できるようにするために必要なすべての機能を提供します。また、CPUとFPUの状態が異なる場合は、指示することができ、FPUの状態を保存FSAVEおよび復元するための指示も提供します。FXSAVEXSAVE最も予知力のある.)

Answer 1

〜のようにザイルズFPUが使用される場所ごとに、カーネルはステートフルと復元をサポートする必要があると述べました。ユーザースペースはFPUを使用できるため、いかなる場合でもコンテキスト切り替えで処理する必要があります（つまり、現在のCPUがあるスレッドから別のスレッドに切り替えられるとき） - 少なくとも以前に実行されているスレッドがFPUを使用している場合。それでは、これをカーネルに拡張してみてはいかがでしょうか？