自動ディスクの問題：dmesgレポートの理解とリスク評価

Question

これは非常に悪いディスクです。ねえ:

[Wed Sep 28 12:29:02 2022] sd 0:0:0:0: [sda] FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Wed Sep 28 12:29:02 2022] sd 0:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
[Wed Sep 28 12:29:02 2022] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
[Wed Sep 28 12:29:02 2022] sd 0:0:0:0: [sda] CDB: Read(16) 88 00 00 00 00 01 84 5d d8 10 00 00 00 08 00 00
[Wed Sep 28 12:29:02 2022] blk_update_request: I/O error, dev sda, sector 6515709968

これは、オペレーティングシステムがディスクからデータを読み取ることができないことを示します。

ねえ:

SMART Attributes Data Structure revision number: 1

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   068   068   010    Pre-fail  Always       -       1510
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       9429
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       6

ディスクは約13ヶ月間実行されました（24×7の仮定、6回の電源サイクルのみ記録されるのが合理的です）。残念ながら、再割り当てされた1510セクターは、私が満足するよりも約1505セクターです。

ここでは、失敗したディスクの読み取りがたくさんあることがわかります。

183 Runtime_Bad_Block       0x0013   068   068   010    Pre-fail  Always       -       1510
187 Reported_Uncorrect      0x0032   099   099   000    Old_age   Always       -       8242

195 Hardware_ECC_Recovered  0x001a   199   199   000    Old_age   Always       -       8242

かなりの数のブロック（おそらく131TB）を作成しましたが、特別なものはありません（SSDは寿命の間に高い書き込み期待を保証し、あなたのブロックは2400TBです）。確かに不均衡ではありません。

241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       35415578583

オペレーティングシステムがディスクに512Bセクタを持っていると認識するのが少し心配です。セクタ/ブロックは4kBでなければなりません。これが本当かどうかを確認するには、fdiskまたは同じツールを使用して確認する価値があります。partedsmartctl

結局、今は新しいディスクを購入する必要がある時だと言いたいと思います。 13ヶ月が経過すると期限切れになることを考えると、12ヶ月の保証があると思いましたが、EVOは5年のようです。

OPはコメントで次のように尋ねました。これらの再配置は、ハードウェアの問題（登録されていないセクタなど）にもかかわらず、ディスクが機能し続ける方法ですか？なぜiostatまだすべてが正常であるとマークされていますか？」。

ディスクセクタ/ブロックを読み取れない場合は、オペレーティングシステムレベルでエラーが発生します。ファイルを読み取ろうとすると（編集、コピー、バックアップ）、IOエラーが発生することがよくあります。ディスクはセクタ/ブロックを読み取れないとマークし、変更できない数が増えます。オペレーティングシステム（またはアプリケーション）がディスク上の対応するセクタ/ブロックにデータを書き込むと、ファームウェアはそのセクタ/ブロックをこの目的のために予約されているスペアセクタ/ブロックの1つに再マッピングする機会があります。変更できない数は減らすことができますが、再割り当てされた数は増えます。

これまで、ディスクファームウェアは1510個のセクタ/ブロックを正常に再割り当てしており、ほとんどのIOは良好です（これがまともにiostat見える理由です）。時には、図に示すように、読み取れない別のセクタ/ブロックに出会いdmesg、書き込みを試みない限り、この問題は消えません。遅かれ早かれ、ディスクは予約されたセクタ/ブロックを使い果たし、一連の書き込みエラーの後にファイルシステムが破損する可能性があります。これは実際には必要な場所ではないため、保証対象のディスクと交換してみることをお勧めします。

にもかかわらず、良いバックアップがあることを確認し、引き続き保管してください。。

Answer 1