私たちの会社には約30〜40のLinux仮想マシンがあります。各Linux仮想マシンには3つのパーティションがあります。
時々、パーティションがいっぱいになり、1つ以上のアプリケーションがハングすることがあります。
30分ごとに実行されるcronjobバッチスクリプトを作成し、しきい値を超えると電子メールを作成できることを知っています。
しかし、デフォルトのLinuxには「監視または警告」インフラストラクチャが組み込まれていませんか?
ベストアンサー1
この問題を解決するために設計されたオープンソース(および独自の)監視ツールがたくさんあります。彼らはLinuxのツールに依存し、これは最終的にカーネルのシステムコールに依存します。
一部のツールはデータの収集と監視に焦点を当て、他のツールは警告に焦点を当て、選択するツールは基本要件によって異なります。
警告および監視ツールの最もよく知られた例は次のとおりです。ナギオス。データの収集とプロットに重点を置いた他のツールには、警告機能が組み込まれています。サボテンそしてムニン。多数のマシンを含む大規模クラスターがある場合神経節おそらく最善の選択でしょう。
これらのツールはしばしばネットワーク監視システムと呼ばれます。Wikipediaには広範なリストがあります。。
ホイールを再発明するのではなく、このようなツールを見つけたり使用したりすることをお勧めします。
使用しているLinuxディストリビューションに応じて、これらのツールの1つ以上がディストリビューションリポジトリですでに利用可能であり、デフォルトで現在の環境をサポートするように構成されています。