
说前提:
R720xd, Esxi 7.0 U2, Intel X540 万兆 SR-IOV 给 WinServer 2019 作为 NAS 使用
发现 samba 局域网共享听歌总是卡顿,iperf3 测试 UDP 丢包达 80%以上!
忘了说了,
1 defunct9 Mar 24, 2021 没头绪,开 ssh,让我上去看看 |
2 hs0000t Mar 24, 2021 via Android 是不是跟 smb 版本有关系? |
3 vibbow Mar 24, 2021 第一想法是去更新 firmware... |
4 willamtang Mar 24, 2021 绕过交换机直连看看还丢包么 |
5 LaTero Mar 24, 2021 via Android iperf3 的 udp 好像有问题,换个再测测看? |
6 tankren Mar 24, 2021 搞个 Ubuntu 虚拟机测试先咯 虚拟化的便利性不利用干啥 |
7 dawnh Mar 24, 2021 有没有经过交换机?有的话看一下交换机是不是又组播相关设置,IGMP snoop 之类的。虽然可能性不高但我见过类似案例的也就这一种可能了。 |
8 kokutou Mar 24, 2021 via Android 就没试过绕过交换机吗。。。 |
9 frostnotfall OP @hs0000t #2 这个应该不是吧,因为丢包没走 smb |
10 frostnotfall OP @willamtang #4 交换机也换过,直连到没试过,因为是虚拟化,宿主机和虚拟机都走一根网线 |
11 frostnotfall OP @vibbow #3 firmware 倒是没想过,反正虚拟机上的 intel 驱动换了个遍,另外宿主机的驱动是集成的,想换也没别的 |
12 frostnotfall OP @kokutou #8 试了,双方都连路由器,也没用 |
13 frostnotfall OP @dawnh #7 IGMP snoop 交换机上有,但是从来没设置过,回去试试,但是好像也不对,都是走的交换机,为何 Ubuntu 没事 |
14 frostnotfall OP @LaTero #5 有什么其他测试 UDP 丢包的工具吗? |
15 weyou Mar 24, 2021 via Android 网线直连 nas 网口测 iperf |
16 ch2 Mar 24, 2021 tcpdump |
17 hahastudio Mar 24, 2021 我前几天更新 Windows 也遇到了类似的问题 我的 Windows 是装在 Parallels 里的虚拟机,NAS 是用 samba 共享的 目前我缓解的办法是在 Parallels 里不用独立网卡了,跟 macOS 共享网络然后就没问题了 想起来你可以试一下 TCP 有没有类似的问题,出问题的时候我用 Windows 访问 NAS 上的 web service 都有问题 |
18 LaTero Mar 24, 2021 via Android @frostnotfall 试试 nuttcp,我之前也是 iperf 报了很高的 udp 丢包,查到了很多相关 issue 和提问,看到 nuttcp 试了下就很正常。 |
19 gBurnX Apr 18, 2021 1.首先要确保,除了 R720xd 之外,其他所有设备,包括别的电脑、网卡、路由器、交换机、网线或光纤,都必须在万兆环境下,测试过,并且能达到线速。 2.R720xd 全格,装 Windows,然后两台 Windows 直接用 Dukto 在内网测网速试试。 测速时,两台电脑请打开任务管理器来监视 CPU 使用率与带宽使用率,打开资源监视器来监视磁盘负载(活动时间)。确保这三个指标低于 100%。 3.如果 3 指标都低于 100%但速度达不到线速,两台电脑换 Linux 系统试试。Linux 系统建议用 ftp 来测试。 测试时,两端打开 top 来监视 CPU 使用率,用 iostat -x -m -d 1 来监视磁盘负载(%util ),用 dstat -t -n -d -c -m -p -s --tcp --udp 来监视网络。 如果还不行,换网卡。 还不行,怀疑机器硬件问题。可以用硬件设备的逐个替换法来实验。比如换个主板,换个 CPU,换个内存等等。 |
20 frostnotfall OP 同步后一个发帖: 困扰半年多的局域网速度问题终于解决了,其中原因令人“暖心”: WinServer 2019 默认开启 RSC ( Receive Segment Coalescing ),可以搜索下 RSC 是什么,简单说就是大量小的数据包交由网卡合并成大包后再交给 CPU,(而之都是由 CPU 直接处理),因而降低了 CPU 的使用率。 微软的初衷是好的,但网很多网卡都出现了严重的性能下降问题,从 Intel 到我的 AQC107 都这样。 结合上面的抓包,丢包导致重传的原因是 CPU 误以为数据包超时了引发重传,其实这时候数据包正在网卡内部处理,正等着继续整合后续的数据包后统一再发给 CPU 的。 我发现问题的时候正是升级到 WinServer2019 之后,然后再退回 WinServer2016 还是不行,就没想是系统的问题。 |