smartcltが報告した安全でないシャットダウンを防ぐ方法は?

smartcltが報告した安全でないシャットダウンを防ぐ方法は?

に基づいてeblockのアドバイスsmartctl、問題を確認するために、過去数日間に何度も実行しています。たとえば、出力は次のようになりますsudo smartctl -a /dev/nvme0n1p2

smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.5.7-1-default] (SUSE RPM)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       Samsung SSD 970 EVO Plus 500GB
Serial Number:                      S4EVNZFN503427W
Firmware Version:                   2B2QEXM7
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Total NVM Capacity:                 500,107,862,016 [500 GB]
Unallocated NVM Capacity:           0
Controller ID:                      4
Number of Namespaces:               1
Namespace 1 Size/Capacity:          500,107,862,016 [500 GB]
Namespace 1 Utilization:            94,943,219,712 [94.9 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            002538 5501ad2a18
Local Time is:                      Wed Dec  2 11:19:04 2020 CET
Firmware Updates (0x16):            3 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size:         512 Pages
Warning  Comp. Temp. Threshold:     85 Celsius
Critical Comp. Temp. Threshold:     85 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     7.80W       -        -    0  0  0  0        0       0
 1 +     6.00W       -        -    1  1  1  1        0       0
 2 +     3.40W       -        -    2  2  2  2        0       0
 3 -   0.0700W       -        -    3  3  3  3      210    1200
 4 -   0.0100W       -        -    4  4  4  4     2000    8000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        38 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    382,321 [195 GB]
Data Units Written:                 695,579 [356 GB]
Host Read Commands:                 4,525,857
Host Write Commands:                9,680,786
Controller Busy Time:               30
Power Cycles:                       205
Power On Hours:                     75
Unsafe Shutdowns:                   73
Media and Data Integrity Errors:    0
Error Information Log Entries:      209
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               38 Celsius
Temperature Sensor 2:               41 Celsius

Error Information (NVMe Log 0x01, max 64 entries)
No Errors Logged

「SMART全体の健康自己評価テストの結果:合格」と「記録されたエラーなし」という行は安心できるように見えますが、次の行はそうではありません。

Unsafe Shutdowns:                   73

~によるとNVMeコマンドラインツールを使用してNVMeフラッシュの状態を確認する投稿者:Peter Zaitsev(2017年2月)、安全でない終了は意味します。

終了通知を送信せずに発生した停電の数。使用しているNVMeデバイスによっては、安全でないシャットダウンによってユーザーデータが破損する可能性があります。

私のTuxedoノートブックが予期せず何度も終了しました(参照:予期しない停電の原因をログファイルで知る方法はありますか?)しかし73番ではありません。

~によるとこのフォーラムの投稿はTom's Harware(2019年4月)にあります。、クイックスタートを無効にすると便利です。これは正しいですか?それとも別のものが必要ですか?

ベストアンサー1

何らかの理由で、私はこのSMARTパラメータが正しいとは思いません。私のSSDを例にすると、次のようになります。

174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       75

このSSDの寿命中にリセットボタンを押したか、電源が20回未​​満に失われたため、これは明らかに間違っています。

比較的安全でなければならないのは、systemdカーネルがシャットダウンする前にバッファをフラッシュするように指示されるため、すべてのダーティキャッシュが実際にデバイスにダンプされるからです。

定期的に適切なバックアップを実行することを忘れないでください。これが最も重要です。

おすすめ記事