ディスクブロックサイズの倍数で読み取り/書き込み操作を実行しないと、パフォーマンスが低下するのはなぜですか？

Question

「より少ない数の呼び出しが必要にもかかわらず、1,130バイトの要求が最終的にソートされていない要求を生成し、1,024バイトの要求よりも効率が悪い」理由は何ですか？

概念的なモデルを提供します。この問題を軽減するいくつかの最適化がカーネルに存在する可能性があります（ただし完全には消えません）。

ブロックサイズが1024の場合、一連のブロックが生成されます。

[1, 1024], [1025, 2048], [2049, 3076], [3077, 4096], ...

1130のブロックサイズが記録されると、write()システムコールへの最初の呼び出しは、1つの要求を満たすために2つのディスクブロックを作成する必要があります。まず、最初の1024バイトをブロックに書き込み、[1, 1024]106バイトを書き込まないままにします。次に、2番目のブロック（[1025, 2048]）を読み取り、残りの106バイトをブロックの最初の106バイトにコピーし、ブロックをディスクに書き戻します。

システムコールへの次の呼び出しは、2番目のブロックを再度読み込みwrite()（[1025, 2048]）、ブロックのバイトに書き込む1130バイトのうち最初の918バイト（1024-106）をコピーしてから、ブロックを[1131, 2048]ディスクに再コピーする必要があります。次に、3番目のブロック（[2049, 3076]）を読み取り、1130の最後の212バイトをブロックの最初の212バイトに書き込み、そのブロックをディスクに書き戻します。

このパターンは続きます。少数の呼び出しにもかかわらず、write()カーネルは既存のブロックに単に書き込むのではなく、既存のブロックを繰り返し読み書き/更新/書き込みする必要があります。

sをブロックサイズに合わせると、write()「チャンクの読み取り、一部の更新、書き換え」の状況は発生せず、チャンクを書き込んで続行でき、読み取り/更新する必要はありません。ペアを満たすための同じチャンクwrite()。

「カーネルが書き込みスモーク、隣接I / O要求の統合、および事前読み取りを介して内部でデータをバッファリングする」場合、ユーザーバッファが必要なのはなぜですか？カーネルバッファはすでにユーザバッファが何をしているのですか？

ユーザー空間はカーネル空間バッファに直接アクセスできません。ユーザー空間バッファは、プログラムがすべてのバイトに対してシステムコールを行わずに「チャンク」を読み取ることができるようにするために必要です（Loveが示すように非効率的です）。

「ファイルシステムジョブがブロックで発生する」とは、ジョブがブロックまたはブロックの整数倍で発生することを意味しますか？

ストレージデバイスとの通信に使用されるデバイスとプロトコルによって異なると思います。

Answer 1