不明な理由でサーバーがシャットダウンする問題があります。これが発生するたびにログをチェックしますが、失敗した理由について特に興味深いものが見つかりません。
問題を診断するのに役立つように、私が何をすべきかを提案できる人はいますか?
ベストアンサー1
ハードウェアの問題のようです。
システムに何かを追加しましたか? RAM、新しいGPU、HDD、PCIカードなど?
物理:
- すべてのケーブルを確認してください。
- RAMのインストールを確認してください。
- すべてのPCIインストールを確認してください。
- CPUを再インストールします(他の効果がない場合)。
- 外部および内部の電源コードを確認してください。
[編集する]:指摘したとおり@ボーンブランド
必要に応じて冷却して清掃してください。
そうでない場合は、次のようにステータスを確認してください。lm_センサーたとえば、重要な値の警告システムを追加します。ここでファンの状態と電圧も確認できます。電圧が表示されない場合は、BIOSがそれを報告していることを確認できます。次に、ハードウェアのファイルを確認して、レベルが正しいことを確認します。下記の電圧計の確認を参照してください。
BIOSをアップデートしてください。
あなたは言う:
[...]なぜ落ちたのか特に興味深い点が見つかりません。
しかし、他のデータはありませんか?
/var/log/messages
/var/log/debug
/var/log/kern.log
...
これは起動時にシステムに問題があることを示していますか?
あなたはマイクのセルローグ走る(機械検査例外)?インストールされていない場合。
smartmontoolsを使ってHDD SMARTデータをチェックしましょう。メモリテスト、ストレステストなどを実行します。
dmesg
テストを実行するときに確認してください。
次のような多くの起動可能なCDのいずれかを使用してください。
適切だと思われるようにテストしてみてください。
サーバーの場合 - オフサイドの場所にいる場合は、コンセントを使用して電話機を充電する管理者がいることを確認してください。
[編集 2]:電源装置の点検。
追加のガイダンスは、PSUチェックにのみ提供されます。オフボード検査は良いことです。この場合、ATXの場合は近道を取ることを覚えておく必要があります。開いている、(通常緑)、グランド(通常黒)はPSUをステージにインポートします。(余分な電線、クリップなどを持参してください。)
その後、1つの電圧計コネクタをグランド(黒)に接続し、もう1つを有色電圧計コネクタに接続して測定を実行できます。その後、±5%の範囲外の正の値または±10%の範囲外の負の値を読み取ると、通常問題が発生します。 (4.1.4 電圧許容誤差)。 12Vは確認するのが最も簡単で、11.40〜12.60Vの範囲でなければなりません。一般的なATXでは、次のようになります。
* Yellow: +12 V; value ⊆ { 11.40 , …, 12.60 }
* Red : + 5 V; value ⊆ { 4.75 , …, 5.50 }
* Orange: + 3.3V; value ⊆ { 3.135, …, 3.465}
* Brown : + 3.3V; value ⊆ { 3.135, …, 3.465}
* Blue : -12 V; value ⊆ {-13.2 , …, -10.8 }
PSUベンダーのマニュアルを確認するか、より一般的な仕様そしてマザーボード仕様。