高負荷の根本原因分析

高負荷の根本原因分析

これは、vmware 5.5で動作する5.7 32ビット仮想マシンです。マスター。負荷平均値が高くなり、CPU使用率が低くなることがわかります。仮想マシンには4つのvCPUがあり、ロードは時々20に達します。

vmstatを実行すると、「r」列に高い値が表示されます。

問題は、カーネル実行キュー内でプロセスを見つける方法です。

ps r -Aのようにインターネット上で見つけたpsの組み合わせを試しましたが、運がありませんでした。

vmstat出力:

[ ~]# vmstat 1 10
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 9  0      8 822516 322880 1593592    0    0     1    65    9    6  1  1 98  0  0
 7  0      8 823136 322880 1593584    0    0     0     0 9387 97411  8  9 84  0  0
53  0      8 823508 322880 1593588    0    0     0   236 8332 108913  9 12 79  0  0
64  0      8 818424 322888 1597548    0    0     0   116 9027 140988 10 11 79  0  0
69  0      8 820284 322888 1597548    0    0     0     0 9095 128715  8 10 83  0  0
64  0      8 820284 322888 1597692    0    0     0     0 8701 119305  9 11 80  0  0
 3  0      8 819540 322888 1597688    0    0     0  4704 9531 112734  8  8 84  0  0
81  0      8 818052 322888 1599452    0    0     0   224 8324 102409 10 13 77  0  0
 8  0      8 816192 322888 1601788    0    0     0  3240 9181 98478  9 11 80  0  0
 7  0      8 815076 322888 1601872    0    0     0     0 9250 104422 10  9 81  0  0 mpstat 1 10
06:04:03 PM  CPU    usr     nice    sys     iowait  irq     soft    steal   guest  idle
06:04:04 PM  all    9.32    0.00    8.82    0.00    0.25    4.03    0.00    0.00   77.58
06:04:05 PM  all    9.85    0.00    8.84    0.00    0.25    4.29    0.00    0.00   76.77
06:04:06 PM  all    8.29    0.00    5.78    0.00    0.50    4.77    0.00    0.00   80.65
06:04:07 PM  all    9.82    0.00    7.81    0.00    0.25    4.28    0.00    0.00   77.83
06:04:08 PM  all    8.84    0.00    5.30    0.00    0.25    4.29    0.00    0.00   81.31
06:04:09 PM  all   10.05    0.00    9.05    0.00    0.50    4.02    0.00    0.00   76.38
06:04:10 PM  all    9.60    0.00    7.32    0.00    0.51    4.04    0.00    0.00   78.54
06:04:11 PM  all    8.33    0.00    5.81    0.00    0.25    4.29    0.00    0.00   81.31
06:04:12 PM  all    9.57    0.00    7.05    0.00    0.25    4.03    0.00    0.00   79.09
06:04:13 PM  all    7.83    0.00    5.05    0.00    0.25    3.79    0.00    0.00   83.08
Average:     all    9.15    0.00    7.08    0.00    0.33    4.18    0.00    0.00   79.25

ベストアンサー1

通常負荷平均は CPU が必要なことが多いために発生しますが、必ずしもそうとは限りません。一般的な原因は、IO(ディスクまたはネットワーク)を待つプロセスです。

実行してps -e vみて、プロセス状態フラグを見つけてください。

state    The state is given by a sequence of characters, for example, "RWNA". The      first character indicates the run state of the process:
D    Marks a process in disk (or other short term, uninterruptible) wait.
I    Marks a process that is idle (sleeping for longer than about 20 seconds).  
L    Marks a process that is waiting to acquire a lock.
R    Marks a runnable process.
S    Marks a process that is sleeping for less than about 20 seconds.
T    Marks a stopped process.
W    Marks an idle interrupt thread.
Z    Marks a dead process (a "zombie").

これはpsマンページにあるため、マンページで詳細を見つけることができ、RプロセスDが特に興味深いことがあります。

おすすめ記事