ハードドライブエラー

ハードドライブエラー

私の/homeファイルシステムはJFSで、ROモードに何度も切り替えられたため、再起動/再マウントする必要があります。 「/var/log/messages」に以下が表示されます。

12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925711] ata2.00: UDMA/133用に構成
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925755] sd 1:0:0:0: [sda] 未処理の検出コード
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925759] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925763] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925770] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925778] 0e 5a b2 b8
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925782] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925785] sd 1:0:0:0: [sda] CDB:
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925815] sd 1:0:0:0: [sda] 未処理の検出コード
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925817] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925820] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925825] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925833] 00 00 00 00
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925836] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925839] sd 1:0:0:0: [sda] CDB:
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925863] sd 1:0:0:0: [sda] 未処理の検出コード
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925865] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925868] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925872] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925879] 00 00 00 00
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925882] sd 1:0:0:0: [sda]  
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925885] sd 1:0:0:0: [sda] CDB:
12月31日 10:12:49 uvv-laptop-y570 カーネル: [983.925908] ata2: EH 完了

そしてsmartctl -a /dev/sda私にこれを与えた:

SMART属性データ構造リビジョン番号:16
ベンダー固有のSMART属性としきい値:
ID#ATTRIBUTE_NAMEフラグ値最悪のしきい値タイプが更新されました。 WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x002f 200200051 常に事前失敗 - 0
  3 Spin_Up_Time 0x0027179174021 常に失敗する前 - 2008
  4 Start_Stop_Count 0x0032099099000 Old_age 常に - 1005
  5 Reallocation_Sector_Ct 0x0033 200200140 常に - 失敗前 0
  7 Seek_Error_Rate 0x002e 200200000 Old_age 常に - 0
  9 Power_On_Hours 0x0032082082000 Old_age 常に - 13675
 10 Spin_Retry_Count 0x0032100100000 Old_age 常に - 0
 11 Calibration_Retry_Count 0x0032100100000 Old_age 常に - 0
 12 Power_Cycle_Count 0x0032100100000 Old_age 常に - 998
192 Power-Off_Retract_Count 0x0032200200000 Old_age 常に - 37
193 Load_Cycle_Count 0x0032 001001000 Old_age 常に - 810861
194Temperature_Celsius 0x0022106091000 Old_age 常に - 41
196 Realowned_Event_Count 0x0032 200200000 Old_age 常に - 0
197 Current_Pending_Sector 0x0032200200000 Old_age 常に - 1
198 Offline_Un 変更可能 0x0030100253000 Old_age オフライン - 0
199 UDMA_CRC_Error_Count 0x0032200200000 Old_age 常に - 0
200 Multi_Zone_Error_Rate 0x0008 200200000 Old_age オフライン - 0

ハードドライブモデル:

モデルシリーズ:Western Digital Scorpio Blue Serial ATA(高度なフォーマット)
装置モデル: WDC WD7500BPVT-24HXZT3
所蔵番号 : WD-WX91A91R4010
LU WWNデバイスID:5 0014ee 601b831c9
ファームウェアバージョン:03.01A03

アップデート:別のセルフテスト(数ヶ月前に最初に実行したテスト)を開始し、いくつかのアップデートを受け取りました。

SMARTセルフテストログ構造改訂番号1
Num Test_Description ステータス 残存寿命 (時間) LBA_of_first_error
#1拡張がオフラインで完了:読み取りに失敗しました90%13680 229857912
#2 オフライン時間延長がエラーなしで完了しました 00% 9661 -
#3拡張がオフラインで完了:読み取りに失敗しました90%9654 96004576
#4拡張がオフラインで完了:読み取りに失敗しました90%9653 96004576

以前は#2から#4までの行がすでにありました。私は次の指示に従いました。不良ブロックガイドそしてデバッグファイルシステム。そのブロックはエラーとして報告されていないように見えますが、再配置されたブロックには含まれず、増加しません。不良ブロックにゼロを書き込んだ後に増加する唯一のものはRaw_Read_Error_Rateです。

問題は新しいハードドライブの注文を検討する必要がありますか?

ベストアンサー1

smartctlマニュアルページから:

印刷された属性テーブルインテリジェント制御また、属性の「タイプ」も表示します。属性は、事前エラーまたは老化の2つの可能なタイプのうちの1つです。事前障害属性は、しきい値以下の場合に保留中のディスク障害を示す属性です。老化または使用量属性は、属性値がしきい値以下である場合、老化または正常な老化および摩耗によって製品の寿命が終了したことを示す属性です。 参考にしてください:属性が「事前失敗」タイプであるという事実は、ディスクがすぐに失敗するという意味ではありません。これは、属性の現在の正規化された値がしきい値以下である場合にのみこの意味を持ちます。

プロパティの現在の正規化された値がしきい値以下である場合は、「WHEN_FAILED」列に「FAILING_NOW」と表示されます。そうではありませんが、最悪の履歴値がしきい値以下の場合、列に「In_the_past」と表示されます。 「WHEN_FAILED」列に項目がない場合(ダッシュマーク:「-」)、属性はOK(失敗しない)であり、過去に失敗したことはありません。

smartctlしたがって、あなたが投稿した出力部分によると、あなたのドライブは実際には良い状態のように見えます。しかし、これは必ずしも他の問題が存在しないという意味ではありません。

残念ながら、このUnhandled sense codeメッセージは何かが間違っていることを意味しますが、カーネルは何が間違っているのかわかりません。残りのsmartctl出力を調べて、問題があるかどうかを確認できます。ドライブの全体的な状態を要約するセクションが必要です。このオプションで個別に受け取ることができます-H

ドライブがセルフテストをサポートしている場合は、次の方法でセルフテストを開始できます。

smartctl -t long /dev/sda

これはバックグラウンドで始まるため、結果を確認する必要があります。ドライブがマウントされていない場合は、-C強制モードを有効にするオプションを追加すると時間がかかりません。shortテストも可能ですが、あまり徹底していません。

物理コネクタなどを確認し、ゆるみがないことを確認するのも良い考えです。もしそうなら簡単に修正できます。

修正する

Wikipediaに良い参考資料があります。スマートプロパティ。 「より良い」列は、最初の正規化された値ではなく、出力の一番右の列にある元の値を表します。 「現在保留部」を言及する部分です。フロストスーツ:

「不安定な」セクタの数(回復不能な読み取りエラーのために再マッピングを待っている間)の後に不安定なセクタを正常に読み取ると、そのセクタが再マッピングされ、この値が減少します。セクタの読み取りエラーはセクタをすぐに再マッピングしません(正しい値を読み取ることができないため、再マッピングする値がわからず、後で値を読み取れないため、代わりにドライブファームウェアがセクタを覚えています)。次の書き込み時に再マップして再マップする必要があります。ただし、一部のドライブは書き込み時にそのセクタをすぐに再マップしないため、ドライブは最初に問題セクタに書き込みを試み、書き込み操作が成功するとそのセクタが良好であるとマークされます(この場合は「再割り当て」イベントカウント」(0xC4 )は増加しません)。これは深刻な欠点です。なぜなら、そのようなドライブに書き込み操作が成功してから一定時間が経過しても失敗し続けるエッジセクタが含まれている場合、ドライブはこれらの問題セクタを再マッピングしないからです。

おすすめ記事