AMD dGPUを追加した後に一時停止/再開が機能しない

AMD dGPUを追加した後に一時停止/再開が機能しない

設定に個別のGPU(AMD RX 6900XT)を追加しました。一時停止/再開が機能しなくなったことを除いて、うまく機能します。以前は、Intel iGPUで動作していてうまく機能していたため、作業中のGPUに問題があるようです。

lspci -k示す:

01:00.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] Navi 10 XL Upstream Port of PCI Express Switch (rev c0)
    Kernel driver in use: pcieport
02:00.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] Navi 10 XL Downstream Port of PCI Express Switch
    Kernel driver in use: pcieport
03:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Navi 21 [Radeon RX 6800/6800 XT / 6900 XT] (rev c0)
    Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Radeon RX 6900 XT
    Kernel driver in use: amdgpu
    Kernel modules: amdgpu
03:00.1 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] Navi 21 HDMI Audio [Radeon RX 6800/6800 XT / 6900 XT]
    Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Navi 21 HDMI Audio [Radeon RX 6800/6800 XT / 6900 XT]
    Kernel driver in use: snd_hda_intel
    Kernel modules: snd_hda_intel
03:00.2 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] Device 73a6
    Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Device 73a6
    Kernel driver in use: xhci_hcd
    Kernel modules: xhci_pci
03:00.3 Serial bus controller: Advanced Micro Devices, Inc. [AMD/ATI] Navi 21 USB
    Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Device 0408
    Kernel driver in use: i2c-designware-pci

lsmod | grep -ie 'amd'示す:

amdgpu               8601600  18
drm_ttm_helper         16384  1 amdgpu
ttm                    86016  3 amdgpu,drm_ttm_helper,i915
gpu_sched              53248  1 amdgpu

xrandr --listproviders示す:

Providers: number : 2
Provider 0: id: 0x58 cap: 0xf, Source Output, Sink Output, Source Offload, Sink Offload crtcs: 6 outputs: 4 associated providers: 1 name:AMD Radeon RX 6900 XT @ pci:0000:03:00.0
Provider 1: id: 0x6f7 cap: 0xf, Source Output, Sink Output, Source Offload, Sink Offload crtcs: 4 outputs: 3 associated providers: 1 name:modesetting

私がしたこと:

  • Xorg.confを作成しました。X -configure
  • amdgpuカーネルモジュールに追加 (in mkinitcpio.conf)
  • ASPMの有効化、iGPUの無効化など、さまざまなBIOS設定を試しました。
  • インストールされたxf86-video-amdgpuパッケージ(明らかなmetaパッケージとVulkanパッケージを除く)
  • iGPUが依然として影響を受ける場合は、ブラックリストに登録されているモジュールi915(blacklist.conf中央)/etc/modprobe.d
  • ブラックリストに登録済みucsi_ccg(表示エラー)
  • インストールされたacpidパッケージ(ログにいくつかの警告が表示されます)
  • amdgpu.dc=0、、、、、、、、カーネルパラメータをamdgpu.reset_method=2試しました。amdgpu.runpm=0nomodesetpcie_aspm=forceacpi_osi=Linuxacpi_osi=Windows
  • カーネルを5.17.1から5.16.6、5.16.3、5.15.13にダウングレード
  • 実験mesa-gitパッケージ(および関連パッケージ)を試しました。
  • メサの再インストール
  • 再インストールlinux-headers
  • 試されたソリューションhttps://gitlab.freedesktop.org/drm/amd/-/issues/1797、同様の問題のようです。

私はGNOME / Xorgと一緒にArch Linux(5.17.1)を使用しています。ハードウェア仕様:Intel 12世代12700、GIGABYTE AERO Gマザーボード使用、32GB DDR5 G.SKILLメモリ搭載。 DisplayPortケーブルを使用してモニター(Alienware AW3420DW)を接続しました。

最後の停止試行のログ(ログ)を見ると、記録されるすべての停止情報は次のとおりです。

apr 02 11:43:43 arch NetworkManager[764]: <info>  [1648892623.2585] manager: sleep: sleep requested (sleeping: no  enabled: yes)
apr 02 11:43:43 arch NetworkManager[764]: <info>  [1648892623.2589] device (wlo1): state change: unavailable -> unmanaged (reason 'sleeping', sys-iface-state: 'managed')
apr 02 11:43:43 arch NetworkManager[764]: <info>  [1648892623.2602] device (wlo1): set-hw-addr: reset MAC address to F0:9E:4A:8A:9B:02 (unmanage)
apr 02 11:43:43 arch NetworkManager[764]: <info>  [1648892623.2623] manager: NetworkManager state is now ASLEEP
apr 02 11:43:43 arch gnome-shell[1091]: Timelines with detached actors are not supported
apr 02 11:43:47 arch systemd[1]: Reached target Sleep.
apr 02 11:43:47 arch systemd[1]: Starting System Suspend...

システムが正常に停止したようです。キーを押すとシステムの電源が入りますが(電源LEDが点灯してファンが回転します)、画面は黒く表示されます。興味深いことに、回復試行のログはありません。別のコンピュータでNVIDIAカードの一時停止/再開の問題を処理しましたが、常に開始された履歴書に関するいくつかの情報を記録しました(その後、通常モード設定の問題によりGPUが見つかりませんでした)。

dmesgXorgログも見ましたが、興味深い内容はありませんでした。少なくとも明らかなエラーや警告はありません。

今のアイデアはほとんどありません。だから、誰かがいくつかのヒントを共有したり、私がもっと詳しく見ることができることを教えてくれることを願っています。

ベストアンサー1

私が解決したようです。

すべてのテスト、カーネル調整、ソースからカーネルの構築、ソリューションが見つからずに数時間デュースを終えた後は、その間にBIOSアップデートがあると思いました。はい:Gigabyteは、「F5」バージョンよりも高いZ690 AERO Gマザーボードの「F6」バージョンをリリースしました。

新しいBIOSバージョンはこの問題をすぐに解決し、現在の5.19カーネルで作業を一時停止/再開するのにバグがないようにします!

残念ながら、BIOSコードは排他的であるため、アップデートのリリースノートは非常にシンプルでやや曖昧です。彼らは新しいCPUのための追加のサポートとDDR5のより良いサポートだけでなく、「パフォーマンスと安定性の更新」をリストします。私の問題と直接関係はありませんが、BIOSコードがスリープ/再開信号を正しく解釈できないという特定の問題があるかもしれません(ログによると、i2c-designware-pci5.12ベースのBIOSコードに問題が発生する可能性があります)。プロセス)。

同様の問題が発生し、BIOSアップデートで問題が解決しない場合は、ここを参照してより多くのアイデアとトラブルシューティング方法を学びます。https://gitlab.freedesktop.org/drm/amd/-/issues/1963

おすすめ記事