Ubuntu Server 20.04(および19.04)はSSDへの書き込み操作が非常に多く、読み取り専用で再インストールします。

Ubuntu Server 20.04(および19.04)はSSDへの書き込み操作が非常に多く、読み取り専用で再インストールします。

私はUbuntu 20.04(前の19.04)を実行する小規模なホームサーバーを運営しています。このサーバーはdockerのみを実行し、通常私がインストールしたZFSプールにデータを書き込みます(このストーリーとは無関係であり、コンテキスト関連ではありません)。

起動ディスクには、EXT4ファイルシステムを備えたKingston A2000 512GB NVMEドライブを使用します。今日の午後と今週も何度もサーバーが応答しなかったため、リモートでログインできませんでした。画面に接続した後、エラーが原因でSSDが読み取り専用でマウントされていることがわかりました。どんなエラーなのかわかりませんでした。再起動後、SSDに不良セクタやその他の問題があるかどうかを確認することにしましたが、何も見つかりませんでした。しかし、SSD(半年)は56TBを使ったが、6TBを読んだという点が目立った。

多すぎて本当に面倒です。 noatimeプロパティを設定してクリーンアップを実行しています。

SSDに保存される唯一の項目は次のとおりです。+/- 30個のDockerコンテナ、Ubuntu 20.04、および2つのコンテナの一部のデータ(Plexメタデータ、Minecraftサーバーの毎日のバックアップ/ファイルを実行しないビデオ/Duplicatiデータベース、Dockerに含まれる内容)よく使わない5人のユーザー)。

高い執筆の最下部を把握しようとしていますが、それを知的または構造化された方法で処理する方法がわかりません。起動後に作成されたすべてのファイルを確認するコマンドがいくつか見つかりましたが、週に手動で確認するには多すぎます。

ドライブが読み取り専用モードに移行し続ける理由はまだわかりませんが、これは別の問題かもしれません。

どんな助けでも大変感謝します!

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-40-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       KINGSTON SA2000M8500G
Serial Number:                      XXXX
Firmware Version:                   S5Z42105
PCI Vendor/Subsystem ID:            0x2646
IEEE OUI Identifier:                0x0026b7
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          500,107,862,016 [500 GB]
Namespace 1 Utilization:            29,767,180,288 [29.7 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            0026b7 282536db15
Local Time is:                      Wed Jul 15 19:53:03 2020 CEST
Firmware Updates (0x14):            2 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size:         32 Pages
Warning  Comp. Temp. Threshold:     75 Celsius
Critical Comp. Temp. Threshold:     80 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     9.00W       -        -    0  0  0  0        0       0
 1 +     4.60W       -        -    1  1  1  1        0       0
 2 +     3.80W       -        -    2  2  2  2        0       0
 3 -   0.0450W       -        -    3  3  3  3     2000    2000
 4 -   0.0040W       -        -    4  4  4  4    15000   15000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        46 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    10%
Data Units Read:                    12,031,713 [6.16 TB]
Data Units Written:                 110,463,016 [56.5 TB]
Host Read Commands:                 248,933,785
Host Write Commands:                1,467,111,619
Controller Busy Time:               9,524
Power Cycles:                       101
Power On Hours:                     4,515
Unsafe Shutdowns:                   5
Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0

Error Information (NVMe Log 0x01, max 256 entries)
No Errors Logged

ベストアンサー1

同僚のフィードバックに基づいて犯人を見つけました。この問題は、Duplicatiが一時ファイルを作成して削除したときに発生したことが判明しました。この問題を解決するために、そのファイルの場所をSSDの代わりにハードドライブに変更しました。

おすすめ記事