aliyun ECS 云服务器,在业务量没有明显变动的情况下,突然 CPU 是平时负荷的两倍了。
流量没变、内存使用没变、各个指标都稳定。就是 CPU 翻倍。虽然整体水平不高,但是担心业务出故障啊。
几个工程师,排查了一上午,没有结果,正在一筹莫展的时候,刚刚突然又降下来了,恢复到正常了。
感觉就像 CPU 降频一样的效果。
![]() | 1 yuzo555 271 天前 我不了解,就我的感觉来说,正常的 100% 基础性能实例,不会这样,是不是用的突发性能型? |
![]() | 2 opengps 271 天前 利用率检查不下来? windows 系统的话很可能是杀毒软件工作了 |
![]() | 3 ayelky 271 天前 ![]() 你那台机器刚好在业务开通高峰期吧,我有的机器每个月月底的性能和月初的差距 30% |
![]() | 4 decken 271 天前 ![]() 阿里云应该有超卖的 |
![]() | 5 PureWhiteWu 271 天前 ![]() 超售基操了 |
![]() | 6 panzhc 271 天前 什么规格的? |
7 standchan 271 天前 ![]() 不是独占机器的话,可能因为同一母机的其他 ecs 影响到了 |
![]() | 8 wangyzj 271 天前 ![]() 超售 |
![]() | 9 daimaosix 271 天前 说规格啊大哥 |
![]() | 10 zhwguest OP 感谢各位大哥的热心帮助,不知道规格是什么意思啊?是说 CPU/Mem/Disk/Band 么?这个应该没有影响吧。 还是说有共享型和独占型的么?我这个是 e 系列的,估计是共享的吧。不知道在什么地方看。 |
![]() | 12 daimaosix 271 天前 ![]() 几个工程师,排查了一上午,找个靠谱的运维都不会去买 e |
13 salmon5 271 天前 ![]() 不错了,几个工程师没有甩锅 CPU 的 bug ,都挺靠谱的 |
![]() | 15 MangozZ 271 天前 有排除过睿频影响吗? 《调整 C-state 状态以降低 vCPU 的响应延迟》 https://help.aliyun.com/zh/ecs/use-cases/change-c-state-status-to-reduce-vcpu-response |
![]() | 16 3wY4ZelqS1uYD4NJ 271 天前 阿里云 e 系列和突发性 t 系列都不要买来用来主业务,我的客户最次也推荐购买 u 实例,可以聊聊沟通一下+alyunflc |
18 sampeng 271 天前 一般不会。就算是竞技性实例规格也不会。反应到你的业务负载上。 但突发性的会,因为没积分了。限额。表现就是 cpu 突然炸了 |
19 ccde8259 271 天前 如果有进程使用了 AVX512 指令集的话…… |
20 dfdd1811 271 天前 我司还出现过 cpu 突然爆满,磁盘读写爆满,然后机器卡死只能重启的情况。不知道阿里的问题还是操作系统的问题 |
![]() | 21 p1gd0g 271 天前 看不到进程吗?没日志?没 atop ? 我们有过业务 bug 导致 cpu 暴涨的 |
![]() | 22 xuanbg 271 天前 非计算型主机一律买突发性能实例,只要你自己的 cpu 不超,别人是影响不到你的。 |
![]() | 23 zhangxudong 271 天前 ![]() @daimaosix #12 我是运维,我们公司用的性能突发实例。没办法实在是太便宜了 |
![]() | 24 iceking156300 271 天前 资源是可以动态分配的,在你开机情况下是可以调整你的内存和处理器的。 |
![]() | 25 daimaosix 271 天前 @zhangxudong 对不起哥,冒昧了 |
![]() | 26 wzw 270 天前 via iPhone @zhangxudong #23 你们使用经验看:业务机器用突发实例够用稳定? |
![]() | 27 zhangxudong 270 天前 @wzw 总体来说还是挺稳定的,一年可能会出现个几次虚拟机卡住或者说是突发的 cpu 性能跟不上的情况 |
28 spritecn 270 天前 @zhangxudong 最低配的那个版本性能没经济版实例好(主要是偶尔需要 cpu 的时候不够用),价格差不多,主要是经济版现在 4 拆,我都切到经济版了 |
![]() | 30 wzw 270 天前 via iPhone @zhangxudong #27 那岂不是偶尔影响业务,老板不介意? |
![]() | 31 zhangxudong 270 天前 @wzw #30 我们是 to b saas 业务,影响不大。而且出问题基本都是半夜,应该是底层宿主机半夜要做什么操作,影响到了 |
![]() | 32 zhangxudong 270 天前 @spritecn 我们买机器都是直接买 5 年的,之前是 3 折 |
![]() | 33 realpg PRO "几个工程师,排查了一上午" 跟你公司说一下,要不一个月给我几千块我给你做云产品规划吧 |
34 maomaosang 44 天前 |