Google ChromeのSegfault - Nvidiaカードに関連していますか?どうすればわかりますか?

Google ChromeのSegfault - Nvidiaカードに関連していますか?どうすればわかりますか?

システム

Linux Mint 19.3 Cinnamon 64ビット、Ubuntu 18.04 LTSベース。


関連ハードウェア


次が何を意味するのか、誰でも教えてもらえますか?特別な私のNvidiaカードに問題がありますか? Google Chrome(安定)側またはドライバnvidia-435のソフトウェアバグかもしれませんか?どうすればわかりますか?

私は自分のコンピュータだけを知っています。必ずぶら下げる1~2秒ほど経過すると次のようになります。

dmesg追跡する

[Thu Jan 16 16:01:38 2020] show_signal_msg: 23 callbacks suppressed
[Thu Jan 16 16:01:38 2020] GpuWatchdog[18858]: segfault at 0 ip 000055a9a5a6077d sp 00007f033f76c6c0 error 6 in chrome[55a9a1b25000+7170000]
[Thu Jan 16 16:01:38 2020] Code: 48 c1 c9 03 48 81 f9 af 00 00 00 0f 87 c9 00 00 00 48 8d 15 19 61 9c fb f6 04 11 20 0f 84 b8 00 00 00 be 01 00 00 00 ff 50 30 <c7> 04 25 00 00 00 00 37 13 00 00 c6 05 f1 6b a4 03 01 80 7d 8f 00

私が何をしていたのか

私はHTML5ゲーム(Forge of Empires)をプレイしています。

ベストアンサー1

いいえ、これはNvidiaカードに問題ではありません。 Chromeも同様です。

最初に起こるのは、Nvidiaソフトウェアがクラッシュしてレンダリングパイプラインが停止することです。その後、数秒後にChromeはGPUがレンダリングされなくなったことを検出し、問題を処理しようとしますが、segfaultのため失敗します。

irq/75 nvidiaマシンがクラッシュしたときにsshに接続して「top」を実行すると、2つのプロセスが100%CPUで交互に実行されることがわかりますnv_queue(割り込み番号はシステムによって異なります)。

また、GpuWatchdog が表示される数秒前に、システムログに NVIDIA ドライバーの一部のメッセージが含まれる場合があります。

Feb 10 17:00:24 natascha kernel: [157260.734117] NVRM: GPU at PCI:0000:08:00: GPU-f622f482-2ad1-4992-4d8a-9d62b465e084
Feb 10 17:00:24 natascha kernel: [157260.734120] NVRM: GPU Board Serial Number: 
Feb 10 17:00:24 natascha kernel: [157260.734124] NVRM: Xid (PCI:0000:08:00): 61, pid=1391, 0cde(308c) 00000000 00000000

この問題の報告はインターネット全体に広がっています。まだ解決策が見つかりませんでした。私の新しいコンピュータでも同じ問題が発生します。 Chromeを実行しても競合は発生しませんが、435から430のドライバに戻すとsyslogメッセージが防止されます(これまで)。


アップデート:430ドライバもクラッシュします。 440ドライバ(Ubuntuの一部ではない)が問題を解決しているようです。少なくともこれ以上問題はありません。 amritsが投稿した投稿です。https://devtalk.nvidia.com/default/topic/1060783/linux/random-xid-61-and-xorg-lock-up/7これを確認しました。

440ドライバはUbuntuディストリビューションの一部ではないので、これが私がしたことです。この情報は以下から得た。https://linuxconfig.org/how-to-install-the-nvidia-drivers-on-ubuntu-19-10-eoan-ermine-linuxこれはUbuntu 19.10に関するものですが、18.04にも当てはまります。

sudo -i
add-apt-repository ppa:graphics-drivers/ppa
apt update

この時点では、ubuntu-drivers devices何よりも次のものを出力する必要があります。

# ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:03.1/0000:08:00.0 ==
modalias : pci:v000010DEd00001F02sv000010DEsd00001F02bc03sc00i00
vendor   : NVIDIA Corporation
driver   : nvidia-driver-440 - third-party free recommended

これでドライバをインストールできます。

apt install nvidia-driver-440

新しいドライバを有効にするには再起動する必要があるため、残りのソフトウェアも更新することをお勧めします。

apt upgrade
apt autoremove
reboot

6月15日アップデート - Nvidiaによると、まだドライバの修正はなく、問題を再現できません。よりフォーラムの投稿。ただし、この問題は、GPUが省電力モードからより多くの電力を使用するモードに切り替えられると、いくつかのマザーボード/ GPUの組み合わせで発生するようです。 GPUをより高い周波数に強制すると、これは起こらないように見え、一部のユーザーは次の回避策を報告します。

nvidia-smi -pm ENABLED
sudo nvidia-smi -lgc 1000,1815

(再起動するたびに繰り返す必要があります)

これは、カードを永久的に(再起動するまで)より高い周波数に設定することでより多くの電力を消費し、寿命を短縮する可能性がありますが、競合の問題を解決するように見えるため、多くのユーザーが好む可能性があります。

おすすめ記事