RAID5を使用するCentOSサーバーがあります。 RAID5が再同期されるたびにサーバーが停止します。ホスティング会社は、RAID5が独自に再同期できるようにhttpdサービスを停止しました。このプロセスには最大3〜4時間かかることがあります。
問題が繰り返され続け、ホスティング会社でサーバーハードウェアを交換し、私は新しいハードウェアに移行しました。新しいサーバーでもこの問題が発生します。
RAID5ではこれは正常ですか?この問題をどのように永久に解決できますか? RAID5は、私のサーバーを再同期しようとするたびに過負荷がかかり、自分のWebサイトにアクセスできなくなった場合はお勧めできません。
今回の災害に対する解決策を提案していただければ幸いです。
これは /proc/mdstat レポートです:
root@host [~]# watch 'cat /proc/mdstat'
Every 2.0s: cat /proc/mdstat Mon May 9 01:25:30 2011
Personalities : [raid1]
md0 : active raid1 xvda1[0] xvdb1[1]
104320 blocks [2/2] [UU]
md1 : active raid1 xvda2[0] xvdb2[1]
2096384 blocks [2/2] [UU]
md2 : active raid1 xvda5[0] xvdb5[1]
484086528 blocks [2/2] [UU]
[=====>...............] resync = 29.5% (142978880/484086528) finish=77.7m
in speed=73108K/sec
unused devices: <none>
ベストアンサー1
RAIDは、サーバーのクラッシュまたは故障したディスクの交換後にのみ再同期する必要があります。常にUPSを使用し、バッテリーが不足しているときにシステムをシャットダウンするように設定して、再起動時に再同期を必要としないようにすることをお勧めします。 NUTまたはacpupsdは多くのUPSと通信でき、UPSの電源が切れる前にシャットダウンを開始できます。競合が発生していない状態でサーバーが再同期されると、ハードウェアの問題が発生する可能性があります。/var/log/kern.log
またはを実行してカーネルログを確認しますdmesg
。また、mdadm
管理者に電子メールを送信するように設定し、smartd
すべてのディスクドライブで実行することをお勧めします。同様に、管理者にメールを送信するように設定することをお勧めします。ディスクエラーが発生する約半分前に電子メールを受信します。避けられない競合が発生した場合は、RAIDで書き込み専用ビットマップを有効にする必要があります。これはディスクの書き込み場所のログを保持し、再起動中の完全な再同期を防ぎます。活性化:
mdadm -G /dev/md0 --bitmap=internal