シングルドライブ読み取りエラーによるソフトウェアRAID-1カーネルエラー

Question

1）再配置されたすべてのセクタが正確に8つに落ちているのはなぜですか？

これらのセクタ数のギャップは予想できるものですが、問題はこれらのギャップがどれだけ大きいか（4k以上）です。 8x 512バイトは4kで、これはほとんどのファイルシステムで使用されるセクタサイズです。したがって、ファイルシステムはRAIDから4kの読み取りを要求でき、RAIDは/dev/sdbそのデータを要求します。最初のセクタ（ログに表示されるセクタ番号）で読み取りが失敗し、RAIDが切り替わり、/dev/sdaそこから4kを提供します。その後、ファイルシステムは次の4kを読み、/dev/sdbセクタ番号+8に戻るように要求しますが、再び失敗します。これは再びログに表示されます。

2) カーネルが応答せずに再起動が必要なのはなぜですか？

通常の状況では、そのようなことは起こらないでください。問題は再分配事件が受けることができる費用の中で最も高価だという点だ。失敗した各読み取りは別のディスクにリダイレクトし、元のディスクに書き換える必要があります。同時にログファイルがいっぱいになると、新しい書き込み要求が発生して再割り当てが必要です。この場合、ディスクを完全に取り外す方が安いでしょう。

また、残りのハードウェア（SATAコントローラなど）が故障したドライブをどのように処理するかについての問題でもあります。コントローラ自体に問題があると、パフォーマンスがさらに低下する可能性があります。

ログエントリがなければ、正確に何が起こったのかを言うのは難しいです。これはLinuxカーネルの弱点であり、状況が本当に悪くなったときに最後のメッセージを保持する簡単な解決策はありません。

3) 攻撃隊の再同期完了後23時間で読み取れず、オフラインで修正できない個数がリセットされるのはなぜですか？

一部の値は、オフラインデータ収集（更新されたオフライン列）を実行したときにのみ更新されるため、時間がかかる場合があります。これを自動的に実行するように設定されている場合（4時間ごとなど）、ディスクによって異なります。ディスクに依存したくない場合は、smartmontoolsを使用して設定する必要があります。

Answer 1

1）再配置されたすべてのセクタが正確に8つに落ちているのはなぜですか？