予測不能なメモリ爆発

予測不能なメモリ爆発

最近、当社のメインサーバーにダウンタイムが多く発生しています。私や他の管理者が知らない理由で、メモリがランダムに(そして非常に突然)爆発します。すべてのメモリを使用するため、応答がなくなり、再起動する必要があります。とても迷惑です。これはDebianシステムです。 Squeezeや他のものにアップグレードしておらず、長い間完全に安定していました。

問題は、ログがまったく役に立たないことです。彼らは何も間違っていたことを示さないようだった。一部のプロセスにバグがあり、メモリをすべて占めているようですが、現在ではこれを証明できません。リモートロギングは何も文句を言わないので役に立ちません。すべてが大丈夫だと思います。

だから私の質問はこんな感じです。この問題をどのように解決しますか?どんな洞察力でも感謝します。ありがとうございます。

ベストアンサー1

リソース使用量の監視と記録に非常に熟練しています。インタラクティブまたはサービスとして使用できます。Debian パッケージ10分ごとに/var/log/atop.logに記録するように設定します(より正確な情報については/etc/init.d/atopを編集してください)。その後、atop -r /var/log/atop.log -b hh:mm -mM;を使用してログを再生できます。 mMは、メモリの問題に適したビューとソートを選択します。 hh:mmはイベントが発生する数分前でなければならず、tTを使用してナビゲートします。カテゴリAを試してみることもできます。

おすすめ記事