rhelシステムで次のcliを実行すると、600行以上CLOSE_WAIT
が表示されます。
lsof -i tcp:8088 | grep CLOSE_WAIT
java 31100 yarn 385u IPv4 208022048 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:56504 (CLOSE_WAIT)
java 31100 yarn 407u IPv4 208210692 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:58918 (CLOSE_WAIT)
java 31100 yarn 408u IPv4 206182798 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:36538 (CLOSE_WAIT)
java 31100 yarn 410u IPv4 208447279 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:60972 (CLOSE_WAIT)
java 31100 yarn 412u IPv4 208287324 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:59820 (CLOSE_WAIT)
java 31100 yarn 413u IPv4 206107964 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:35704 (CLOSE_WAIT)
.
.
.
.
.
私が知っている限り、サーバーとクライアント間の通信中にclosed_wait
サーバーのソケット障害による状況が発生します。
それでは、Linux側でいくつかの設定を行う機会がありますか?セッションを最小限に抑えるにはclose wait
?
それともアプリケーション側の唯一のソリューションであるべきですか?
ベストアンサー1
私はこれがアプリケーションのバグかもしれないと思います。開いているファイル/ソケットの最大数を使い果たす前に、アプリケーションを再起動するか、人為的な制限のulimit設定を増やすことで制御できます。
次のバグレポートを見つけてください。
- https://issues.apache.org/jira/browse/YARN-9336
- https://issues.apache.org/jira/browse/YARN-4754
- https://issues.apache.org/jira/browse/YARN-10207
または直接報告してください(サポートの場合)。これらの問題の議論については、以下を参照してください。https://stackoverflow.com/questions/15912370/how-do-i-remove-a-close-wait-socket-connection