求助:实验《动手测试单机百万连接》只能达到 102610 个连接 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
xing393939
V2EX    Linux

求助:实验《动手测试单机百万连接》只能达到 102610 个连接

  •  1
     
  •   xing393939
    xing393939 2023-01-03 16:14:56 +08:00 2650 次点击
    这是一个创建于 1019 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我按照《动手测试单机百万连接》教程在 2 台 vps ( 2 核 4G ,ubuntu 22.04 )上做,每次都只能建立 102610 个连接,有碰到相同问题的吗?

    2 台 vps 的内核配置最终是:

    # sysctl net.ipv4.ip_local_port_range fs.file-max fs.nr_open net.ipv4.tcp_max_orphans net.ipv4.tcp_max_syn_backlog net.ipv4.tcp_mem net.ipv4.tcp_rmem net.ipv4.tcp_wmem net.ipv4.ip_local_port_range = 5000 65000 fs.file-max = 1100000 fs.nr_open = 1100000 net.ipv4.tcp_max_orphans = 1000000 net.ipv4.tcp_max_syn_backlog = 4096 net.ipv4.tcp_mem = 600000 800000 1000000 net.ipv4.tcp_rmem = 4096 4096 6291456 net.ipv4.tcp_wmem = 4096 4096 6291456 # ulimit -n 1000000 

    实验是根据教程的方案二来的,vps1 起 20 个 server 进程监听 20 个端口,vps2 起 20 个 client 一一对应,每个 client 发起 5w 个连接。

    实验启动后查看连接的状态:

    # ss -s Total: 102808 TCP: 102635 (estab 102610, closed 0, orphaned 0, timewait 0) # netstat -ant|awk '{print $4}'|sort|uniq -c|sort -nr 5557 172.31.27.20:8103 5553 172.31.27.20:8100 5537 172.31.27.20:8105 5253 172.31.27.20:8106 5207 172.31.27.20:8114 5196 172.31.27.20:8113 5101 172.31.27.20:8116 5096 172.31.27.20:8101 5044 172.31.27.20:8117 5040 172.31.27.20:8107 5033 172.31.27.20:8104 4999 172.31.27.20:8119 4999 172.31.27.20:8118 4999 172.31.27.20:8115 4999 172.31.27.20:8112 4999 172.31.27.20:8111 4999 172.31.27.20:8110 4999 172.31.27.20:8109 4999 172.31.27.20:8108 4999 172.31.27.20:8102 

    可以看到每个 server 只建立了 5000 左右的连接,离 5w 还差很远。另外此时两台 vps 执行curl baidu.com都会 hang 住,此时 vps 应该是既不能 accept 又不能 connect 。不知道哪里还需要配置才能成功。

    13 条回复    2023-01-05 09:49:11 +08:00
    vhwwls
        1
    vhwwls  
       2023-01-03 16:27:37 +08:00
    能上十万已经接近极限了,这个配置单台百万不太可能吧
    v2wtf
        2
    v2wtf  
       2023-01-03 16:29:24 +08:00
    你这配置太低了
    cat9life
        3
    cat9life  
       2023-01-03 16:32:00 +08:00
    看起来挺有趣,不懂。系统资源占用情况吗?
    lookStupiToForce
        4
    lookStupiToForce  
       2023-01-03 16:40:02 +08:00
    有意思
    关注一下

    原文博主说他测试修改了一个星期才成功,但没说具体怎么调试的,op 你可以把你的测试也记录一下补足这个过程
    opengps
        5
    opengps  
       2023-01-03 16:42:11 +08:00
    没必要继续网上测试了。
    我在前东家实际业务,在职期间达到过 300 万 TCP 长连接,用了上百台低配( 2C4G ) ecs 负载。
    为什么说没必要单机高负载:因为需要更好的容灾,一台机器故障或者升级重启时候影响的客户端更少。实际发现连接数多了之后,重启客户端之后的密集连接会导致连续十多分钟的资源满载,恢复过程缓慢不是被业务上能接受的。所以限制了单台服务器平均承载不超过 2 万(虽然实际到过单机承载 5 万)
    opengps
        6
    opengps  
       2023-01-03 16:44:23 +08:00
    另外,客户端是每个链接单独占用一个系统端口的,op 的测试方案中,看起来 2 台服务器都同时用做了客户端,端口数可能达到了上限,需要改进下客户端的模式,增加模拟客户端的服务器的数量。单独用一个服务端去承载多连接测连接数指标。
    vhwwls
        7
    vhwwls  
       2023-01-03 16:45:16 +08:00
    @opengps #5 op 应该主要考虑的不是实际用途,纯粹是出于好奇心想测试一下,我也觉得生产里面不可能让一台入口负载那么多的连接。
    opengps
        8
    opengps  
       2023-01-03 16:47:45 +08:00
    看漏了一句,“ps1 起 20 个 server 进程监听 20 个端口,vps2 起 20 个 client 一一对应”。
    这里单机单进程 client 显然无法发起 5w 个连接,多增加几个客户端机器再测吧
    lookStupiToForce
        9
    lookStupiToForce  
       2023-01-03 16:47:50 +08:00
    刚刚发现 op 的一个问题
    原文中方案二的服务 /客户端的 fs.nr_open 都是用的 60000 ,不知道为什么 op 设置成了 1100000
    opengps
        10
    opengps  
       2023-01-03 16:48:50 +08:00
    @vhwwls #7 是的,做过这行的通常都会想上手测一下,这个过程很有意思。
    tinybaby365
        11
    tinybaby365  
       2023-01-03 16:52:41 +08:00
    需要多几个 client ,或者 client 多绑几个 ip 。
    zizon
        12
    zizon  
       2023-01-04 12:51:32 +08:00
    两台 curl 都卡住估计是端口用完了...
    xing393939
        13
    xing393939  
    OP
       2023-01-05 09:49:11 +08:00
    @opengps 我测试只用 2 个 client ,每个 client 是能建立 5w 个连接的,只是再增加一个 client 就会达到 102610 这个极限点( 102610 不是绝对的,比如有时候是 102607 )
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2677 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 13:52 PVG 21:52 LAX 06:52 JFK 09:52
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86