阿里 ECS 突然 CPU 和磁盘 IO 跑满,如何去查,给阿里提工单有用吗 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
devzhaoyou
V2EX    程序员

阿里 ECS 突然 CPU 和磁盘 IO 跑满,如何去查,给阿里提工单有用吗

  •  
      devzhaoyou 2024-05-11 17:13:38 +08:00 3197 次点击
    这是一个创建于 526 天前的主题,其中的信息可能已经有所发展或是发生改变。

    RT

    17 条回复    2024-05-14 12:05:54 +08:00
    leaflxh
        1
    leaflxh  
       2024-05-11 17:38:13 +08:00
    可能内存满了
    hefish
        2
    hefish  
       2024-05-11 17:43:07 +08:00
    这个还是得自己看吧。 主要通过 top, vmstat 等命令看看,找到具体是啥原因。 是内存耗尽了呢,还是跑了大负载的应用了
    salmon5
        3
    salmon5  
       2024-05-11 17:44:38 +08:00
    top/iotop
    phx1
        4
    phx1  
       2024-05-11 17:59:14 +08:00
    装个监控告警工具
    displayabc
        5
    displayabc  
       2024-05-11 18:09:02 +08:00   1
    就是内存爆满,好几年都这样了,公司一台测试机每周都出这个,只能重启
    chauncychan
        6
    chauncychan  
       2024-05-11 18:10:39 +08:00
    监控都打掉了,只能上主机看了
    Nosub
        7
    Nosub  
       202405-11 22:48:41 +08:00 via iPhone
    参考一下我 blog ,其实阿里云有官方排除步骤,https://nosub.net/posts/p/100
    JKOR
        8
    JKOR  
       2024-05-12 00:38:16 +08:00 via Android
    内存满了,阿里云的小内存机子都这样,内存一满就卡死,只能重启。

    机子默认没开 swap ,打开后可以缓解这个问题。我自从开启 swap 就没卡死过了。
    j8sec
        9
    j8sec  
       2024-05-12 04:41:58 +08:00
    安装 atop ;
    我遇到过,是 AliYunDun 这个垃圾的锅。卸载就没了
    hellolinuxer
        10
    hellolinuxer  
       2024-05-12 19:49:23 +08:00
    通过监控图看到,指标降下来了,这时候看不到现场,有什么办法能看到现场吗?
    fkdtz
        11
    fkdtz  
       2024-05-12 22:10:05 +08:00
    有过类似经历,我当时情况是被种了挖矿脚本导致 CPU 跑满。
    解决办法是 top 找到异常进程干掉,找到异常 cron 清理掉,再把没有认证的端口都封掉。
    CFM880
        12
    CFM880  
       2024-05-13 09:58:54 +08:00
    AliYunDun
    cloud-init-local.service

    去年是 ssh 连不上,但是重启能连,卸载两个后,很稳定
    Mirana
        13
    Mirana  
       2024-05-13 12:51:15 +08:00
    流量是哪来的?
    paynezhuang
        14
    paynezhuang  
       2024-05-13 14:05:09 +08:00
    我也前几天遇到过,看看日志呢。我是 CPU 内存全爆。

    阿里工单的答复:
    是 dnf 在刷新元数据。这个是 centos8 以及相关衍生操作系统的默认配置,您可以执行下面命令进行关闭:
    systemctl disable dnf-makecache.timer --now

    devzhaoyou
        15
    devzhaoyou  
    OP
       2024-05-13 21:28:49 +08:00
    安装 atop 了,强制重启了,监控看看,机器上没装什么耗能的东西
    devzhaoyou
        16
    devzhaoyou  
    OP
       2024-05-14 12:03:56 +08:00
    @JKOR 感谢,准备试试
    devzhaoyou
        17
    devzhaoyou  
    OP
       2024-05-14 12:05:54 +08:00
    @CFM880 感谢
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2533 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 11:20 PVG 19:20 LAX 04:20 JFK 07:20
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86