S3でスリープモードを解除/再開した後、6つのHDDのうち1つが消える(RAMに一時停止)

S3でスリープモードを解除/再開した後、6つのHDDのうち1つが消える(RAMに一時停止)

数日間systemctl suspendコンピュータ(S3 / RAMを一時停止)するたびに、ハードドライブの1つが消えました。それでも存在しますが、/dev/sdbもう/dev/sda存在しません。消えるのは常に同じハードドライブです。 SMART長期テストでは、ハードドライブが完全に正常であることがわかりました。ただし、目覚めるたびに消えます。スリープモードを解除すると、次のようなメッセージが表示されます(sdb / sd 2のメッセージを参照)。/dev/sdc/dev/sdf

[191432.762381] ata5: found unknown device (class 0)
[191432.762411] ata6: found unknown device (class 0)
[191433.228546] ata3: SATA link down (SStatus 0 SControl 300)
[191437.422376] ata6: softreset failed (device not ready)
[191437.422391] ata5: softreset failed (device not ready)
[191438.290401] ata4: found unknown device (class 0)
[191438.450381] ata4: softreset failed (device not ready)
[191438.450414] ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[191438.454123] ata1.00: configured for UDMA/133
[191438.608510] ata3: SATA link down (SStatus 0 SControl 300)
[191438.608521] ata3.00: disable device
[191438.608540] sd 2:0:0:0: rejecting I/O to offline device
[191438.608547] ata3.00: detaching (SCSI 2:0:0:0)
[191438.608554] sd 2:0:0:0: [sdb] Start/Stop Unit failed: Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[191438.608558] sd 2:0:0:0: PM: dpm_run_callback(): scsi_bus_resume+0x0/0x80 returns -5
[191438.608567] sd 2:0:0:0: PM: failed to resume async: error -5
[191438.630402] sd 2:0:0:0: [sdb] Synchronizing SCSI cache
[191438.630423] sd 2:0:0:0: [sdb] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[191438.630424] sd 2:0:0:0: [sdb] Stopping disk
[191438.630428] sd 2:0:0:0: [sdb] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[191442.774382] ata6: found unknown device (class 0)
[191442.774417] ata5: found unknown device (class 0)
[191443.174399] ata6: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[191443.266633] ata6.00: configured for UDMA/133
[191443.294401] ata5: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[191443.387415] ata5.00: configured for UDMA/133
[191443.802389] ata4: found unknown device (class 0)
[191445.942401] ata4: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[191446.128870] ata4.00: configured for UDMA/133

修復されたことを示すために別のディスクの行が含まれていましたが、「sd 2」/「sdb」は含まれませんでした。

これは最近のLinuxカーネルのアップグレードで発生した可能性がありますが、これを確認するために簡単にダウングレードすることはできません。頻繁に再起動できないプロダクションマシンです(ディスクなしで作業することも、必要に応じてUSB経由で接続することもできます)。

ディスクを手動でリセットした場合、またはカーネルにウェイクアップ/再開時にそのタスクを実行するように指示または確認する必要がある他のエラーメッセージがある場合は、この問題をどのように解決できますか?

編集:電源とSATAケーブルを交換しましたが、役に立ちませんでした。

編集2:

# foreach d ( /sys/class/scsi_host/host*/scan )
foreach? echo "- - -" > $d
foreach? echo was $d
foreach? sleep 2
foreach? lsblk
foreach? echo =========
foreach? end

…助けにならず、悲しいことに/dev/sdbまだ消えました。

ベストアンサー1

解決策は、問題のハードドライブ製造元(東芝)に連絡することです。彼らは、ブート/ブート要求によく反応する修正されたファームウェアを送信しました。新しいファームウェアは、「I'm Ready」信号をより早く(電源を入れてから約1秒)送信します。これはBIOSやLinuxカーネルが期待しているようです。 BIOS/マザーボードまたはOSが原因でタイムアウトが小さすぎるかどうかを理解できませんでした。

おそらく、これは標準の家庭用コンピュータの企業用ハードドライブに関するものであると付け加えるべきです。ディスクが高速起動用に設計されていない可能性があります(サーバーの世界には存在しません)。

おすすめ記事