5.15.15 AMD GPUが過熱してカーネルアップデート後に終了する現象(Pop!_OS 21.10)

5.15.15 AMD GPUが過熱してカーネルアップデート後に終了する現象(Pop!_OS 21.10)

私はここでフォーラムに初めて入りましたが、最近システムアップデートをインストールした後に経験するいくつかの珍しい問題について質問があります。カーネル 5.15.15 (または最新の Mesa ドライバー - 21.3.6) にアップグレードした後、ロード時に GPU が緊急ジャンクション温度 (115C) に達し、警告とともに閉じずにシステムが実行される問題が発生しました。

Feb 11 23:02:23 pop-os kernel: amdgpu 0000:07:00.0: amdgpu: ERROR: GPU over temperature range(SW CTF) detected!
Feb 11 23:02:23 pop-os kernel: amdgpu 0000:07:00.0: amdgpu: ERROR: System is going to shutdown due to GPU SW CTF!

完全なsystemd / journaldログを見つけることができます。ここamdgpu エラーは行 256 付近で発生し、その後のすべてのログは終了プロセスを示します。

通常、私はシステムがこの温度に達する前にGPUを調整する必要があると思いますが、私が間違っている可能性があります。とにかく問題は新しいようです。以前のカーネル(5.13)とMesaドライバ(残念ながら以前のバージョン番号はわかりません)を使用して同じ環境でシステムを実行しても、システムがシャットダウンまたはシャットダウンしたことはありません。システムがシャットダウンする原因になりますか? WindowsでGPUを実行する際に問題があります。ただし、最新のシステムアップデートから24時間、この問題は3回発生しました。

文脈に応じて、私のシステムは次のようになります。

  • オペレーティングシステム: Pop!_OS 21.10 x86_64
  • カーネルバージョン: 5.15.15-76051515-generic#202201160435~1642693824~21.10~97db1bb
  • GPU 1: AMD Radeon RX 6800 XT
  • GPU 2:Nvidia GeForce RTX 3060 Ti(Linuxでは使用されず、ドライバはインストールされません)
  • CPU: AMDライゼン7 5800X

これが既知の問題か解決できる問題かを知っている人はいますか?どんな助けでも大変感謝します!

よろしくお願いします!

ベストアンサー1

おすすめ記事