100以上のサービス監視

100以上のサービス監視

ユーザー単位で実行される2MBバイナリなどの軽量サービスがありますが、各サービスごとにわずかに異なる構成で実行される120の類似サービスがあります。

これらすべてのサービスを監視し、それらのいずれかがダウンした場合は、APIエンドポイントを介して警告を発生させたいと思います。

これまで、私はリスト(1行に1つのサービス名)を繰り返すbashスクリプトを書いていました。

systemctl status name.service

サービスのステータスとサービス名も表示されますgrepawk最後に、ifこのwhileループには、サービスの1つがアクティブでない場合(実行中)、投稿をAPIエンドポイントにカールする条件があります。

私はこのスクリプトを1分ごとに実行する予定です。私はあまり心配しておらず、次の質問があります。

  1. 毎分クローンが多すぎますか?
  2. このようなスクリプト/クローンタブでどのような点に注意する必要がありますか?
  3. もっと良い方法がありますか?これは私に少しアマチュアのように見えますが、それを行うための迅速な方法です。

私はcrontabに問題が発生する可能性があることを心配していますが、それが遅すぎるまでそれを知らない、または他のものが損傷する可能性がある、または悪い場合はシステムがクラッシュする可能性があることを心配しています。

ここでより良い道がある場合、どのようなアイデアがありますか?

ベストアンサー1

これはコメントでなければなりませんが、少し長いです。

監視できるフリーソフトウェアパッケージが多すぎることを考えると、これは問題を解決する奇妙な方法のようです。

規模の問題があります(規模の問題は常に存在しますが、より適切なプラットフォームを使用すると、これらの問題は数倍になる可能性があります)。たとえば、各インスタンスが応答するのに1秒以上かかるとどうなりますか?機能的な問題があります。ウォッチウィンドウを定義する方法、問題を知らせる方法、監視したいが通知しないウィンドウはどうですか?介入の効果を測定するために記録をどのように管理しますか? ...

結局、モニタリングプラットフォームで実行されます。早く始めるほど、今後は痛みが少なくなります。

おすすめ記事