Ubuntuノートブックのハードロックをどのようにデバッグするのですか?

Ubuntuノートブックのハードロックをどのようにデバッグするのですか?

私はしばらくThinkpad T450でUbuntuを実行してきました。

時々システムは私にハードロックを与える。たとえば、マウスが動かずctrl-alt-f#を押すと、通常の端末に移動しません。

まだマジックsysreqキーを試していません。次に試してみますが、楽観的ではありません。

以下は当時Journalctlの一部です(この問題を解決するために永続ロギングを有効にしました)。

Jul 07 16:53:27 gothputer systemd[1]: Starting Cleanup of Temporary Directories...
Jul 07 16:53:27 gothputer systemd-tmpfiles[5215]: [/usr/lib/tmpfiles.d/var.conf:14] Duplicate line for path "/var/log", ignoring.
Jul 07 16:53:27 gothputer systemd[1]: Started Cleanup of Temporary Directories.
Jul 07 16:55:13 gothputer kernel: perf interrupt took too long (5045 > 5000), lowering kernel.perf_event_max_sample_rate to 25000
Jul 07 16:57:59 gothputer systemd-timesyncd[786]: Timed out waiting for reply from 91.189.94.4:123 (ntp.ubuntu.com).
Jul 07 16:57:59 gothputer systemd-timesyncd[786]: Synchronized to time server 91.189.89.199:123 (ntp.ubuntu.com).
Jul 07 17:12:40 gothputer kernel: thinkpad_acpi: EC reports that Thermal Table has changed
Jul 07 17:17:01 gothputer CRON[6044]: pam_unix(cron:session): session opened for user root by (uid=0)
Jul 07 17:17:01 gothputer CRON[6045]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Jul 07 17:17:01 gothputer CRON[6044]: pam_unix(cron:session): session closed for user root
Jul 07 17:25:13 gothputer wpa_supplicant[1206]: wlp3s0: WPA: Group rekeying completed with e0:3f:49:e2:3f:c4 [GTK=CCMP]
Jul 07 17:41:35 gothputer sudo[7819]: pam_ecryptfs: pam_sm_authenticate: /home/zee is already mounted
Jul 07 17:41:35 gothputer sudo[7819]:      zee : TTY=pts/1 ; PWD=/home/zee/Downloads ; USER=root ; COMMAND=/usr/bin/gdebi N1.deb
Jul 07 17:41:35 gothputer sudo[7819]: pam_unix(sudo:session): session opened for user root by zee(uid=0)
Jul 07 17:41:43 gothputer sudo[7819]: pam_unix(sudo:session): session closed for user root
-- Reboot --
Jul 07 17:48:21 gothputer systemd-journald[313]: Runtime journal (/run/log/journal/) is 8.0M, max 118.9M, 110.9M free.
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpuset
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpu
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpuacct
Jul 07 17:48:21 gothputer kernel: Linux version 4.4.0-28-generic (buildd@lcy01-13) (gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2.1) ) #47-Ubuntu SMP Fri Jun 24 10:09:13 UTC 2016 (Ubuntu
Jul 07 17:48:21 gothputer kernel: Command line: BOOT_IMAGE=/boot/vmlinuz-4.4.0-28-generic.efi.signed root=UUID=3862c22d-6f33-42a1-8bde-d05dc9f1af16 ro quiet splash vt.handoff=7
Jul 07 17:48:21 gothputer kernel: KERNEL supported cpus:
Jul 07 17:48:21 gothputer kernel:   Intel GenuineIntel
Jul 07 17:48:21 gothputer kernel:   AMD AuthenticAMD
Jul 07 17:48:21 gothputer kernel:   Centaur CentaurHauls
Jul 07 17:48:21 gothputer kernel: x86/fpu: xstate_offset[2]:  576, xstate_sizes[2]:  256
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x01: 'x87 floating point registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x02: 'SSE registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x04: 'AVX registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Enabled xstate features 0x7, context size is 832 bytes, using 'standard' format.

この特定のロック期間中、私のデスクトップの時計は参考までに17:47:40に固定されました。

次のステップは何ですか?見つけることができるすべてのログを読む以外は、「何」が失敗するのかは明らかではないので、どこから始めるべきかわかりません。

ベストアンサー1

閉鎖の明確な理由がない場合に試すこと

  • CPUの最高動作温度がどれくらいか、製造元に問い合わせてください。
  • BIOSまたはオンボード診断(使用可能な場合)がエラー(電圧、ファン速度、温度、スマートエラー)を検出していることを確認してください。
  • sudo service lightdm stopグラフィックなどを除いてコンソールのエラーメッセージを表示するには、X(同様のもの)をオフにします。
  • lm-sensorsパッケージをインストールして構成します。そこでもすべてが大丈夫です。
  • 次のようにセンサーを操作し続けます。watch -n1 sensors
  • 出力に注意してくださいdmesg。カーネルについてすべてを教えてくれます。
  • ALT-F1(F2、F3)スイッチ画面
  • アプリケーション内でCPUバーナーまたはその他のプログラムを実行して、stressCPUと出力を加熱しますsensors。 CPUのすべてのコアを使用していることを確認してください。
  • smartctlをインストールしてsmartmontools実行してハードドライブを照会し、セルフテストを実行します。
  • memtest86RAMを確認するには、他の実行可能なアプリケーションを試してください。またはmemtesterLinux内で試す必要がある場合
  • 一度試してみるか、bonnie++ハードddドライブにストレスをかけてみてください。

これがうまくいっているようであれば、X、特にグラフィックハードウェアやドライバ(過去の経験に基づいて)を疑うことになります。 Nvidiaドライバを使用している場合は、提供されているGUIユーティリティで温度とファンの速度を確認できることがわかります。

おすすめ記事