Linux
rhel + 任何最佳實踐,以最小化來自 linux 端的 CLOSE_WAIT 會話
當我們在我們的 rhel 機器上執行以下 cli 時,我們得到超過 600
CLOSE_WAIT
行lsof -i tcp:8088 | grep CLOSE_WAIT java 31100 yarn 385u IPv4 208022048 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:56504 (CLOSE_WAIT) java 31100 yarn 407u IPv4 208210692 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:58918 (CLOSE_WAIT) java 31100 yarn 408u IPv4 206182798 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:36538 (CLOSE_WAIT) java 31100 yarn 410u IPv4 208447279 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:60972 (CLOSE_WAIT) java 31100 yarn 412u IPv4 208287324 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:59820 (CLOSE_WAIT) java 31100 yarn 413u IPv4 206107964 0t0 TCP master02.hgti.com:radan-http->master02.hgti.com:35704 (CLOSE_WAIT) . . . . .
據我所知,在伺服器和客戶端之間的通信過程中,
closed_wait
發生了由伺服器的套接字故障引起的所以有機會從 Linux 端做一些設置嗎?為了盡量減少
close wait
會話?或者它應該是應用程序方面的唯一解決方案?
我認為這可能是您的應用程序中的一個錯誤,如果您在用完打開文件/套接字的最大數量之前重新啟動應用程序,或者增加 ulimit 設置的任何人為限制,也許您可以控制它。
嘗試查找錯誤報告,例如:
- https://issues.apache.org/jira/browse/YARN-9336
- https://issues.apache.org/jira/browse/YARN-4754
- https://issues.apache.org/jira/browse/YARN-10207
或者自己報告(如果這是您的申請)。有關此類問題的討論,請參閱:https ://stackoverflow.com/questions/15912370/how-do-i-remove-a-close-wait-socket-connection