これが詰まる前に最後に重要なメッセージです。
top - 18:26:10 up 238 days, 5:43, 3 users, load average: 1782.01, 1824.47, 1680.36
Tasks: 1938 total, 1 running, 1937 sleeping, 0 stopped, 0 zombie
Cpu(s): 2.4%us, 3.0%sy, 0.0%ni, 0.0%id, 94.5%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 65923016k total, 65698400k used, 224616k free, 13828k buffers
Swap: 33030136k total, 17799704k used, 15230432k free, 157316k cached
ご覧のとおり、hadoop get
コマンドを実行するプロセスを約2000個開始したため%と非常に高いです。メモリとCPUを制限しますcgroups
。ディスクIOも制限すると役に立ちますか?それでは、誰もがこれを行う方法について考えることができますかcgroups
?よろしくお願いします。
ベストアンサー1
システムは多くのスワップ(17Gスワップを使用)を実行しており、通常のプロセスでそのドライブへのI / Oが非常に遅くなるため、結果として%wa
。
100%確かではありませんが、交換自体もその数%wa
に直接影響を与える可能性があります(通常、kswapd
プロセスを通じて、あなたの場合はCPUを最も使用しているプロセスかもしれません)。
まず、スワップがまったく(または非常に少なく)使用されるようにプロセス数を制限し、次に%waを再確認して、実際にそのプロセスのI / Oを制限する必要があるかどうかを評価します。