FedoraでMatlabを使用するときに発生する「ハードウェアエラー」は本当にハードウェアの問題ですか、それともソフトウェアの問題ですか?

FedoraでMatlabを使用するときに発生する「ハードウェアエラー」は本当にハードウェアの問題ですか、それともソフトウェアの問題ですか?

Fedora 20 で Matlab 2012 を使用する場合、FFT の計算やグラフィックの描画の途中または後に次のような問題が頻繁に検出されます。

エラーメッセージは次のとおりです。

[  635.157606] mce: [Hardware Error]: CPU 4: Machine Check Exception: 4 Bank 0: b650200000000135 
[  635.157606] mce: [Hardware Error]: TSC 22cd709f356 ADDR 5989fdd80
[  635.157606] mce: [Hardware Error]: PROCESSOR 2:100fa0 TIME 1462430327 SOCKET 0 APIC 4 microcode 10000dc
[  635.157606] [Hardware Error]: MC0 Error: Data/Tag DRD error.
[  635.157606] [Hardware Error]: Error Status: System Fatal error.
[  635.157606] [Hardware Error]: CPU:4 (10:a:0) MC0_STATUS[-|UE|-|PCC|AddrV|UECC]: 0xb650200000000135
[  635.157606] [Hardware Error]:MC0_ADDR: 0x00000005989fdd80 
[  635.157606] [Hardware Error]: cache level: L1, tx: DATA, mem-tx: DRD
[  635.157606] mce: [Hardware Error]: Machine check: Invalid
[  635.157606] Kernel panic - not syncing: Fatal machine check on current CPU
[  635.157606] Kernel Offset: 0x0 from 0xffffffff81000000 (relocation range: 0xffffffff80000000-0xffffffff9fffffff)
[  635.157606] drm_kms_helper: panic occurred, switching back to text console

ソフトウェア(Matlabなど)、またはハードウェア(CPU、My CPUはAMD X6 1055T)のためですか?この問題をどのように解決できますか?

ベストアンサー1

これはハードウェアエラーです。特に、これは検出されたが修正されていないECCメモリエラーでした。どのように知っていますか?上記の出力をパイプするmcelog --asciiと、次のようになります。

Hardware event. This is not a software error.
CPU 4 0 data cache TSC 22cd709f356 
ADDR 5989fdd80 
TIME 1462430327 Thu May  5 02:38:47 2016
  Data cache ECC error (syndrome a0)
       bit45 = uncorrected ecc error
       bit57 = processor context corrupt
       bit61 = error uncorrected
  memory/cache error 'data read mem transaction, data transaction, level 1'
STATUS b650200000000135 MCGSTATUS 4
CPUID Vendor AMD Family 16 Model 10
SOCKET 0 APIC 4 microcode 10000dc

PROCESSORその行が含まれていない古いカーネルメッセージの場合は、実際のシステムで使用されているCPUの種類を知って指定する必要があります。ただし、その行を使用してシステムで出力を実行した場合はローカライズされます)。

おすすめ記事