故障したドライブへの再起動、デバイス名の変更、サーバーの起動に失敗しました

故障したドライブへの再起動、デバイス名の変更、サーバーの起動に失敗しました

両方のサーバーでこの問題が発生しており、この問題をどのように処理するかを知りたいです。私のサーバーには1つのSSD(/ dev / sda)と2つのSATAドライブ(/ dev / sdbと/ dev / sdc)があります。

2番目のドライブ(/ dev / sdb)に問題があります。ドライブはありますが、ファイルシステムに問題がある場合もあり、デバイスが完全に消えることもあります。

ケース1-ドライブがある場合(ls /dev表示されますが)ファイルシステムに問題があります。サーバーを再起動します(デバイスが使用中でfsckを編集できないため)。一部のサービスがそのドライブに依存し、これらのサービスが何らかの方法で停止するため、サーバーは起動しません。起動プロセス。

ドライブは、/etc/fstab の /sdb1 および /sdc1 ディレクトリにインストールされます。

ケース2-ドライブ(/dev/sdb)が消えると、3番目のドライブ(以前の/dev/sdc)の名前が/dev/sdbに変更されました。これは、私のプログラムがドライバを見ると予想したものと異なるため、問題が発生したと思います。プログラムが新しい sdb のデータを表示できないため、サーバーは再起動されません。


質問1:障害が発生したドライブの依存関係を確認できない場合でも、一部のサービスが起動するようにサーバーを構成するにはどうすればよいですか。

質問2:他のドライブが消えた場合(ハードウェアエラーなど)、異なる/ dev / nameを持つドライブを防ぐにはどうすればよいですか?

ベストアンサー1

バックアップ今/dev/sdb

SSDは心臓発作のように突然死にますが、HDDはがんのようにゆっくりと死にます。

あなたがやろうとしているのは、ハードウェアの問題に対するソフトウェアソリューションを見つけることです。ドライブを次のように交換する必要があります。消えるドライブは最後の力を消費し、今すぐ死ぬことを意味します。

ddrescue同じまたはより大きいサイズの車両に画像を駆動するために使用されます。

これはあなたの質問に対する答えではありませんが、まさにあなたに必要なものです...

おすすめ記事