3.10.0-957.12.1.el7.x86_64
次の2つのNVMeディスクが設定されたCentOS 7サーバー(カーネル)があります。
# lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
nvme0n1 259:0 0 477G 0 disk
├─nvme0n1p1 259:2 0 511M 0 part /boot/efi
├─nvme0n1p2 259:4 0 19.5G 0 part
│ └─md2 9:2 0 19.5G 0 raid1 /
├─nvme0n1p3 259:7 0 511M 0 part [SWAP]
└─nvme0n1p4 259:9 0 456.4G 0 part
└─data-data 253:0 0 912.8G 0 lvm /data
nvme1n1 259:1 0 477G 0 disk
├─nvme1n1p1 259:3 0 511M 0 part
├─nvme1n1p2 259:5 0 19.5G 0 part
│ └─md2 9:2 0 19.5G 0 raid1 /
├─nvme1n1p3 259:6 0 511M 0 part [SWAP]
└─nvme1n1p4 259:8 0 456.4G 0 part
└─data-data 253:0 0 912.8G 0 lvm /data
モニタリング結果によるiostat
と、継続的に80%以上のio利用率が見られますが、個々のパーティションのio利用率は0%で、完全に利用可能です(250,000 iops、毎秒1 GBの読み取り/書き込み)。nvme0n1
nvme1n1
avg-cpu: %user %nice %system %iowait %steal %idle
7.14 0.00 3.51 0.00 0.00 89.36
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
nvme1n1 0.00 0.00 0.00 50.50 0.00 222.00 8.79 0.73 0.02 0.00 0.02 14.48 73.10
nvme1n1p1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
nvme1n1p2 0.00 0.00 0.00 49.50 0.00 218.00 8.81 0.00 0.02 0.00 0.02 0.01 0.05
nvme1n1p3 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
nvme1n1p4 0.00 0.00 0.00 1.00 0.00 4.00 8.00 0.00 0.00 0.00 0.00 0.00 0.00
nvme0n1 0.00 0.00 0.00 49.50 0.00 218.00 8.81 0.73 0.02 0.00 0.02 14.77 73.10
nvme0n1p1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
nvme0n1p2 0.00 0.00 0.00 49.50 0.00 218.00 8.81 0.00 0.02 0.00 0.02 0.01 0.05
nvme0n1p3 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
nvme0n1p4 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
md2 0.00 0.00 0.00 48.50 0.00 214.00 8.82 0.00 0.00 0.00 0.00 0.00 0.00
dm-0 0.00 0.00 0.00 1.00 0.00 4.00 8.00 0.00 0.00 0.00 0.00 0.00 0.00
この動作の根本原因が何であるかというアイデアはありますか?
高いIOアラートをトリガーするモニターを除いて、すべてが正常に機能しているようです。
ベストアンサー1
誤った出力の原因は、iostat
RHEL / CentOSバージョン7.7で修正されるカーネルのバグに関連しているようです。スケジューラが設定されているデバイスは影響を受けます。これはNVMEドライブのデフォルトです。 %util
svctm
kernel-3.10.0-1036.el7
none
参考までにRed Hat ソリューション(ログインが必要)エラーについて説明します。
内部にCentOSのバグレポート誰かが上記のカーネル/ディストリビューションのバージョンで上記の問題を解決すると思いました。
スケジューラを変更すると、新しいカーネルが利用可能になるまで問題は解決されます。これは実際のパフォーマンスではなく指標にのみ影響するように見えるため、新しいカーネルが出るまでこれらの指標を無視することも可能です。
NVMEドライバがないため、これを確認できません。おそらく@michal kralikがこれを確認できるでしょう。