「NMI Watchdog:BUG:Soft Lockup」がハードウェアまたはソフトウェアの問題であるかどうかをどのように検出しますか?

「NMI Watchdog:BUG:Soft Lockup」がハードウェアまたはソフトウェアの問題であるかどうかをどのように検出しますか?

ソフトロック

dmesgラップトップで見て、久しぶりです。NMI watchdog: BUG: soft lockup 毎回updatedbまたはを使ってみましたfirefox。レポートコンテンツのサンプルは、次の場所に公開されています。https://github.com/zfsonlinux/zfs/issues/4536#issuecomment-280894134

関連質問はい

私も次の項目を読んでコメントしました。https://github.com/zfsonlinux/zfs/issues/4536

質問

ハードウェアの問題なのか、カーネル/ソフトウェア関連の問題なのか、どうすればわかりますか?


詳細

Linuxディストリビューション

Funtoo-Linux、ローリング分布

コア

私は(少なくとも)次のカーネルバージョンで「バグ」を観察しました。

パフ

  • 4.11_p4-pf
  • 4.8_p8
  • 4.5_p4

CK

  • 4.12.7-ck

Debian

  • lts-4.9.30
  • 4.8.x
  • 4.7.8

構成

カーネルをコンパイルするためにカスタム設定を使用します。基本的には、「ソフトロック」の問題や「監視」関連の問題がないときに長い間使用してきたのと同じ構成です。

設定ファイルをコピーして貼り付けるかリンクできます。しかし、「必須」という2つの重要な設定があることがわかりました。

CONFIG_KALLSYMS=y
CONFIG_PREEMPT_NONE=y

ZFS

ZoLバージョンを使用すると、「BUG」が観察された。

  • 0.6.5.11
  • 0.6.5.10
  • 0.6.5.9
  • 0.6.5.8
  • 0.6.5.3

ベストアンサー1

ハードウェアの問題かもしれませんが、コード成熟度~のLinux用ZFSコード、そして多くの人が複数のバージョンで同じメッセージについて文句を言っています。私はこれがソフトウェアのバグだと言いたいです。

複数のエラーがあります競争条件ZFSコードでは、本番システムではまだ完全に信頼できないのが現実です。

ノートブックが遊び場/テストシステムの場合、ZFS +を試すことはソフトウェアとハ​​ードウェアの問題を解決するのに良いZFSテストです。FreeBSD、これはよりテストされ、信頼性の高いコードベースを持っています。

追加のコメントによると、過去にLinux + zfsの信頼性の高い構成がわかっている場合は、再度テストして除外することをお勧めします。可能質問。

実際のカーネルレベルのコードをデバッグする方法は次のとおりです。sysdigただし、システムがハングアップすると、ログを注ぐ前にシステムがシャットダウンする可能性があり、これが問題の原因である可能性があります。

おすすめ記事