APEI一般ハードウェア障害

APEI一般ハードウェア障害

私のサーバー(Debian Jessieを実行)が先週に2回再起動されました。システムログには、再起動するたびにこの内容が表示されますが、それ以外は表示されません。

Aug 15 13:32:58 hoshimiya kernel: [296512.005355] {1}[Hardware Error]: Hardware error from APEI Generic Hardware Error Source: 1
Aug 15 13:32:58 hoshimiya kernel: [296512.005360] {1}[Hardware Error]: It has been corrected by h/w and requires no further action
Aug 15 13:32:58 hoshimiya kernel: [296512.005361] {1}[Hardware Error]: event severity: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005362] {1}[Hardware Error]:  Error 0, type: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005363] {1}[Hardware Error]:  fru_text: CorrectedErr
Aug 15 13:32:58 hoshimiya kernel: [296512.005364] {1}[Hardware Error]:   section_type: memory error
Aug 15 13:32:58 hoshimiya kernel: [296512.005365] [Firmware Warn]: error section length is too small

一部のインターネット検索では、これはECC RAMがエラーを検出して回復することに関連していると考えました。そうですか?回復する場合、システムが再起動されるのはなぜですか?可能であれば、システムが再起動しないようにしたいと思います。

ベストアンサー1

RAMが正しく機能していないような、または修正中のエラーがあります。重大度によっては、これらのエラーが実行機能に影響を与え、後で再起動する必要があるように聞こえます。

このスレッドの外観で、エラーセクションの末尾にある長すぎるメッセージビットが原因である可能性があります。

抜粋[パッチ1/1] efi:cper:さまざまな長さのエラー部分をサポート

最新のUEFI仕様では、一部のフィールドがエラーセクションに追加されることがあります。たとえば、UEFI仕様2.3以降、「予約済み」、「ランク番号」、「カードハンドル」、および「モジュールハンドル」フィールドが「メモリエラーセクション」に追加されました。残念ながら、メモリ修正エラーが検出され、struct acpi_generic_dataの「revision」フィールドが0x203(UEFI仕様2.3)より小さい場合、次の警告メッセージが表示されます。

{1}[Hardware Error]: Hardware error from APEI Generic Hardware Error Source: 3
{1}[Hardware Error]: It has been corrected by h/w and requires no further action
{1}[Hardware Error]: event severity: corrected
{1}[Hardware Error]:  Error 0, type: corrected
{1}[Hardware Error]:   section_type: memory error
[Firmware Warn]: error section length is too small

この動作により、修正されたエラーが正しく表示されません。この問題を解決するために、パッチはさまざまな UEFI 仕様バージョンのさまざまな長さのエラー部分をサポートします。

また、パッチは事前定義された構造を使用してcper_estatus_print_section関数の重複コードをクリーンアップします。

このパッチを適用すると、注入されたエラーの後にメモリ修正エラーが正しく表示されることがあります。

GrantleyプラットフォームとIntel RAStoolを使用してv3.14-rc5でテストされました。

したがって、この特定のバグのパッチが開発されており、最新バージョンのカーネルで利用可能になる可能性があります。

おすすめ記事