ext4:不良ブロックが修正されましたが、このディスクが死んでいますか?

ext4:不良ブロックが修正されましたが、このディスクが死んでいますか?

4TB WD Green SATA [WDC WD40EZRX-22SPEB0]のUbuntu 17.04。

スーパーブロックの破損により、マウント(起動時にfstabで)が失敗しました。 fsckで/inodeが破損していると報告しましたが修正されました。 99%のファイルが回復しました(失われた少数のファイルはバックアップにあります)。回復されたボリュームは正常にマウントされ実行されます。

SMARTデータを見るとディスクそれは問題ではありません。 「拡張された」smartctlテストに合格しました。データがバックアップされます(業務上重要ではありません)。すでに交換用ドライブがあります。今では「無関係な」ポリシーを採用し、ディスクを交換したいと思う誘惑がありますが、この製品は£100アイテムなので、不安定なディスクを捨てて記録されたすべての不良ブロックと一緒に保管したくありません。

これはsmartctlダンプです。ディスクが本当に死んでいるのでしょうか、それとも単なる事故ですか?

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       61
  3 Spin_Up_Time            0x0027   195   176   021    Pre-fail  Always       -       7225
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       770
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -       12325
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       730
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       40
193 Load_Cycle_Count        0x0032   194   194   000    Old_age   Always       -       18613
194 Temperature_Celsius     0x0022   121   106   000    Old_age   Always       -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       21

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     12320         -
# 2  Short offline       Completed without error       00%     12311         -

ベストアンサー1

SMART読み取り値によると、現在のディスク状態は良好なようです。

興味深いディスクセクタは次のとおりです。

  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -    0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -    0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -    0

再割り当てされたセクタは、書き込みに失敗してディスク上の他の場所に再マップされたセクタです。これらのうち少量は許容されます。ゼロは素晴らしいです。

現在保留中のセクタ値は、他の場所に再割り当てされるのを待っているセクタの数です。 (読み取りに失敗しましたが、ディスクはセクタが再マップされる時点である書き込み要求を待っています。)これはしばらくゼロ以外の状態になる可能性があり、セクタを上書きすると数字が減少して再マップされます。 -マッピングされます。割り当てられたセクタの数が増えます。

修正できないオフラインセクタの数は、エラーが発生して再マップできないセクタの数です。ゼロ以外の値はデータが失われるという意味なので、悪いニュースです。 0の値は大丈夫です。

次のグループは、ディスクドライブの使用期間を示しています。

  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -    770
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -    12325
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -    730

お使いのデバイスは12325時間(連続時間の場合は約18ヶ月)実行されており、この期間中にデバイスが起動して終了した回数は730回です。毎日電源を切ると、ディスクは2年間約16時間実行されます。

最終的には、毎週テスト全体を予約することをお勧めします。などのコマンドを使用してこれを実行できますsmartctl -t full /dev/sda。テストエラーが原因で懸念が発生する可能性があります。

# 1  Extended offline    Completed without error       00%     12320         -
# 2  Short offline       Completed without error       00%     12311         -

NASでお使いの方はNAS級ディスクをお勧めします。個人的にはWD Redがこの点ではとても良いと思います。コストは少し高いですが、保証期間は長くなります。

おすすめ記事