ロックスクラスタスレーブは自発的にリセットされますか?

ロックスクラスタスレーブは自発的にリセットされますか?

私はRocks Clusterをベースにした小規模クラスター(4ノード)を「管理」しています。最近の再起動後、スレーブノードはすべて自発的にオペレーティングシステムを再インストールし、完全な設定、インフィニバンドサポート、インストールされたソフトウェアなどを消去することにしました。

システムがなぜこれを行うのか理解できず、まったく役に立ちません。以前このようなことが起こった人はいますか?その原因は何ですか?

冗談で言うと、ノードを元の仕様に合わせて再構築することをあきらめた可能性があるので、スレーブが正常に動作した場合、どのようにバックアップしますか?

追加情報:

また、試行されたpingによると、ヘッドノードはデフォルトでインターネットにアクセスできないようです。また、ローカルDNSアドレス(192.168.0.1)に対してpingを実行できないようです。

ベストアンサー1

少なくとも場合によっては、Rocksが起動するたびにデフォルトでスレーブノードに再インストールされることがわかりました。(1)。おそらく意図は、クラスタが常にオンになっていて再起動すると、再インストールによって利点を得るためにいくつかの変更が行われたことを意味します。時々使用されるシステムでは、完全な再インストールを完了するためにすべてのインストール後にスクリプトを構成できないため、これは適切ではありません。再インストールを避ける方法は次のとおりです。

rocks run host compute "chkconfig rocks-grub off"

これにより、Computeグループのすべてのスレーブノードで機能が実行され、再インストール機能が無効になります。

私の場合、自動再インストールを避けるために、スレーブノードが最初にローカルドライブから起動するように設定されています。この問題は、強制停電によってローカルディスクが破損し、次回の起動時に破損したローカルディスクが起動できなくなり、再インストールの指示を受けてヘッドノードからPXEブートに引き継がれたために発生したと思います。強制電源オフは、shutdown nowスレーブデバイスの操作が不明な中断のために発生します。物理的に電源を切ると、システムがシャットダウンする可能性があります。今使っているのにshutdown -h nowバニラ終了を妨げるすべての問題を克服したようです。

おすすめ記事