「ノースブリッジエラー(ノード0):プローブフィルタディレクトリにECCエラーがあります。」

「ノースブリッジエラー(ノード0):プローブフィルタディレクトリにECCエラーがあります。」

私は自分のサーバーの1つで発生し、エラーが深刻な問題を示すことを心配しているユーザーから電子メールを受け取りました。問題は以下のエラーですみんな続行する必要があります。私は一般的に自分自身をかなり優れたGoogleの従業員だと思いますが、この場合一つ「プローブフィルタカタログ」に関連してユーザーにエラーが発生したその他のイベント:

[1044 snapshots @ abc]$
Message from syslogd@abc at Sep  8 02:51:51 ...
  kernel:[Hardware Error]: CPU:0 
MC4_STATUS[Over|CE|MiscV|-|AddrV|-|Poison|CECC]: 0xdc0248d0001f010b

Message from syslogd@abc at Sep  8 02:51:51 ...
  kernel:[Hardware Error]:       MC4_ADDR: 0x0000000000010f40

Message from syslogd@abc at Sep  8 02:51:51 ...
  kernel:[Hardware Error]: Northbridge Error (node 0): ECC Error in the 
Probe Filter directory.

Message from syslogd@abc at Sep  8 02:51:51 ...
  kernel:[Hardware Error]: cache level: L3/GEN, tx: GEN, mem-tx: GEN

私が知っている限り、これはちょうど一度起こった。ログ内の他のハードウェアエラーを調べたため、このイベント以外には見つかりませんでした。

上記で引用したフォーラムの投稿は基本的に一度だけ発生し、致命的な問題を引き起こさない場合は心配しないようにユーザーに通知します。これは、あまりにも多くの変数(例えば、9月8日午前2時50分に実行されていたプログラム?)に言及した同僚からのアドバイスと同じです。

しかし、ユーザーはシステムに問題がないことを確認したいと思います。上記のエラーは何を示すか、関連していますか? 「プローブフィルターカタログ」とは何ですか?これにより、コンピュータに差し迫った破滅が発生しないことをユーザーに確認するためにどのテストを実行できますか?

このコンピュータのLinuxディストリビューションはRed Hat Enterprise Linux Serverバージョン6.4(Santiago)です。

ベストアンサー1

正確な答えはありませんが、一部はおなじみです。 Probe Filterディレクトリは何であるかわかりませんが、CptSupermrktは上記で説明しています。

PCIでは、ノースブリッジはメモリとプロセッサに接続されています。 ECCエラーはDRAMに関連しています。各ワードにはエラー訂正コードビットが格納される。読み取り時に更新されたことを確認してください。 ECC エラーは修正可能または修正不可能です。これは、記録されたビットを使用してエラーを修正できることを示します。修正できなかったとしても、永続的なハードウェア障害が発生したわけではありません。このような状況は、DRAM にエラーが発生し始めたときに発生します。

これらすべてを考慮すると、これは一時的なバグのように見えます。完全なメモリテストを試してみることもできますが、結果が出る可能性はほとんどありません。 DRAMに障害が発生した場合、唯一の修正はDRAMを交換することです。

おすすめ記事