md/linux RAIDが故障したドライブを正しく補償する場合は、何を見るべきですか?

md/linux RAIDが故障したドライブを正しく補償する場合は、何を見るべきですか?

サブシステムがmd劣化した状態で実行中であることを示すメッセージ(または次のドライブエラーに正常に対応したことを示す可能性がある他のメッセージ)をsyslog / systemd-journalに出力しますか?ここにヒントをください)?

sdたとえば、次のガイドラインには多くのエラーが表示されますが、Unrecovered read error「代替場所での再試行の成功」などの内容は表示されません。たぶん何もないことが良いニュースでしょうか?

過去には、イメージングソフトウェア/ハードウェアは、デバイスのパフォーマンスが低下したり、注意が必要な時期を示すシステムログエントリを生成しました。mdこれをしないでください。

背景:問題のシステムがデプロイされており、リモートで監視されています(syslog / logメッセージではmdadm現在、どのような対話型コマンド/アクセスも使用できません)。

ベストアンサー1

2つのラウンドロビンデバイスで構築されたRAID 1アレイのクイックテストを実施しました。

dd bs=1M count=100 if=/dev/zero >/tmp/0.img
cp /tmp/0.img /tmp/1.img
i0=$(losetup --show --find /tmp/0.img); echo $i0
i1=$(losetup --show --find /tmp/1.img); echo $i1
mdadm --create /dev/md99 --metadata default --level 1 --raid-devices 2 $i0 $i1

半分を誤って設定する

mdadm --manage /dev/md99 --set-faulty $i1    # For me, $i1=/dev/loop1

カーネル(およびその他の関連RAID1メッセージ)でこれを提供します。

Oct 6 17:36:10 pi kernel: [4087450.030438] md/raid1:md99: Disk failure on loop1, disabling device
Oct 6 17:36:10 pi kernel: [4087450.030438] md/raid1:md99: Operation continuing on 1 devices.

おすすめ記事