召喚/株主タスクのタイムアウトを設定できますか?

召喚/株主タスクのタイムアウトを設定できますか?

conjure-upを介してlocalhostにNovaLXDでOpenStackをインストールしようとしていますが、常にタイムアウトします...(自宅で開発/学習目的で)

私のハードウェアはかなり古いです。 eBayから購入した古いDell Poweredge 2850(2004年頃)です。 HTが有効なデュアルシングルコアXeon(論理4台)、16GB RAM、6xU320ドライブがあります。 PERCコントローラが破損していますが、raw SCSIモードでは正しく動作します(ソフトウェアRAID(LVM + MD)設定を使用します)。 Conjure-upでは16GBと2コアを推奨しているため、最終結果が少し遅くても十分です。 SSDもお勧めしますが、コンテナを数回起動しようとしている間、ハードドライブの活動はあまり見られませんでした。

いくつかを微調整しようと数回試した後はここにとどまり、「少し」だけもっと時間を費やすと、この作業が正常に機能すると思います。 2回連続してみましたが、同じ結果が出て、召喚/ジュジュによる早急さを除けばすべてが正常に終わるように見えました。

私の想像のログの尾は次のとおりです。

2018-12-10 19:09:48,717 [INFO] conjure-up/openstack-novalxd - common.py:47 - Waiting for deployment to settle.
2018-12-10 20:45:05,352 [ERROR] conjure-up/openstack-novalxd - juju.py:745 - DEBUG:root:cinder/0 workload status is maintenance since 2018-12-11 02:45:40Z
DEBUG:root:glance/0 workload status is maintenance since 2018-12-11 02:47:53Z
DEBUG:root:keystone/0 workload status is maintenance since 2018-12-11 02:56:09Z
DEBUG:root:neutron-api/0 workload status is maintenance since 2018-12-11 02:42:12Z
DEBUG:root:neutron-gateway/0 workload status is maintenance since 2018-12-11 02:42:46Z
DEBUG:root:nova-cloud-controller/0 workload status is maintenance since 2018-12-11 03:01:57Z
DEBUG:root:nova-compute/0 workload status is maintenance since 2018-12-11 02:59:49Z
DEBUG:root:openstack-dashboard/0 workload status is maintenance since 2018-12-11 03:07:32Z
DEBUG:root:rabbitmq-server/0 workload status is error since 2018-12-11 03:44:39Z
ERROR:root:rabbitmq-server/0 failed: workload status is error
2018-12-10 20:45:05,358 [DEBUG] conjure-up/openstack-novalxd - events.py:52 - Setting Error at conjureup/events.py:149
2018-12-10 20:45:05,360 [ERROR] conjure-up/openstack-novalxd - events.py:161 - Unhandled exception in <Task finished coro=<DeployController._wait_for_applications() done, defined at /snap/conjure-up/1034/lib/python3.6/site-packages/conjureup/controllers/juju/deploy/gui.py:81> exception=DeploymentFailure('Some applications failed to start successfully.',)>
Traceback (most recent call last):
  File "/snap/conjure-up/1034/lib/python3.6/site-packages/conjureup/controllers/juju/deploy/gui.py", line 82, in _wait_for_applications
await common.wait_for_applications(view.set_footer)
  File "/snap/conjure-up/1034/lib/python3.6/site-packages/conjureup/controllers/juju/deploy/common.py", line 50, in wait_for_applications
await juju.wait_for_deployment()
  File "/snap/conjure-up/1034/lib/python3.6/site-packages/conjureup/juju.py", line 747, in wait_for_deployment
"Some applications failed to start successfully.") 
conjureup.errors.DeploymentFailure: Some applications failed to start successfully.
2018-12-10 20:45:05,456 [DEBUG] conjure-up/openstack-novalxd - __init__.py:27 - Showing dialog for exception: Some applications failed to start successfully.

2行目は(安全な推測で)1時間後(サーバーの負荷がかなり高いため、数秒追加)、タイムアウトを示し(私はGMT-7です)、これまで2回複製されました。

その時点で、Cephクラスタは「ほぼ」動作しており、他のものはブロックされ、まだ完了していないログに表示されているサービスの残りの半分を待っています(まだパッケージをインストールしています)。 1時間以上待っても大丈夫だと思いますか?

(rabbitmqが実行されていますが、サーバーのロードによって他のサービスがエラーと準備/待機の間を行き来しますが、まもなく自己修正されます。つまり、このエラーは発生しません)

コマンドラインまたは他の手段でタイムアウトを設定できますか?

ところで、サーバーはUbuntu 18.04とLXD 3.7を実行しています。 LXDのデフォルトのストレージ設定はBTRFSで、ネットワークはデフォルトのブリッジです(br0 - lxdの場合はlxdbr0ではありません)。

ベストアンサー1

はい、ZFSプールに切り替えます。展開には5.8時間かかり、展開後は30分かかりました。

私が気づいたもう1つのことはRAM使用率でした(top別のウィンドウで見ました)。 BTRFSを使用すると変動が激しくなりますが、3GBを超えることはほとんどなく、バフ/キャッシュは残りのRAMを排他的にします。 ZFSを使用すると、3〜4 GB以上にすばやく到達し、増え続け、展開が完了し、サービスの実行が開始されるまでバフ/キャッシュを1 GBの空き容量に残しました。

したがって、ファイルシステムキャッシュにBTRFSを使用すると、システムメモリに負荷がかかりすぎ、プロセスが最大効率で実行されないようです。

おすすめ記事