英語になっている点ご了承ください。
高可用性モード学習のためにIBM Platform HPC v4.2をインストールしています。
私の研究室は次のとおりです。
- 物理マシン Fedora 25: 共有ストレージ用 nfs3
- VM1: 管理者 1: RHEL 6.5
- VM2: 管理者 2: RHEL 6.5
インストールプロセスは次のとおりです。
- 最初の管理者:manager1にphpcをインストールします。
- 2番目の管理者:manager2にphpcをインストールします(同じオプションを使用)。
- HA用のNFS3共有(ホームとデータ)の設定
- Manager1でのHAインストールトリガー
これらの手順はすべて正常に完了しましたが、HAのインストールが完了するとphpc webminインターフェースにログインできず、一部のサービス/デーモンが実行されないというエラーが発生しました。
いくつかの調査の最後に問題を発見しましたが、少なくとも1つはあるようです。 :-)
問題は開始されたがそのポート(61616)にバインドされていないActiveMQプロセスで発生します。 - ポートは無料で、ファイアウォールで開いています。
activemqプロセスは/opt/pcm/activemq/dataを使用して、ログファイル、pidファイル、およびデータベースを含むkahadbディレクトリを保存します(私はactivemqについてはわかりません)。
HAモードでは、データディレクトリは/shared_phpc/opt/pcm/activemq/dataにマウントされているnfs3共有にコピーされ、/opt/pcm/activemq/dataの両方の管理者にシンボリックリンクが作成されます。このディレクトリを指します。
/opt/pcm/activemq/data -> /shared_phpc/opt/pcm/activemq/data
シンボリックリンクの名前を変更し、HAインストーラでバックアップされた物理ディレクトリを使用すると、activemqプロセスは正常に開始されますが、シンボリックリンクを使用すると起動せずに起動されますが、そのポートにバインドされません。
アクセス権の問題であることを確認するために、共有データディレクトリ内のすべてのファイルを削除することもありましたが、そうではありませんでした。 activemqプロセスが開始され、ログファイル、pidファイル、kahadbディレクトリ、ロックファイル、およびkahadbディレクトリが再生成されますが、kahadbファイルが生成され、正しく起動されません。
私のログファイルにはエラーメッセージがなく、今はどこを見るべきかわかりません。
よろしくお願いします。