
我所在公司轮流值班,有时候告警很多,一晚上都睡不好,第二天还要继续上班,感觉非常痛苦。问下其他公司也是这样吗?如果想换公司该怎么选
1 NamelessRain 2024-12-29 02:40:43 +08:00 我觉得应该把问题提出来到开发那边为什么业务那么不稳定? 是什么导致的告警无法自动化解决吗? |
2 yyzh 2024-12-29 02:57:16 +08:00 oncall 也没道理单人 7X24 |
3 Tumblr 2024-12-29 10:35:33 +08:00 follow the sun ,在不同时区有不同的值班团队。 |
4 Beats 2024-12-29 10:46:59 +08:00 首先,告警是否都是有问题的,没问题的告警让负责人下掉,下不掉就让他们自己接收别告给值班人。 其次,如果告警确实是代码有问题,责令负责人多久内修改完问题。 最后,告警分好级别,普通告警能容忍几小时后处理的就不要打电话,白天处理,晚上夜里打电话告警的都必须是要资损那种。 |
5 k9982874 2024-12-29 10:53:30 +08:00 via Android 只有最紧急的故障(如服务下线)才会立即处理,其它报警第二天上班再说 |
6 kingcanfish 2024-12-29 16:22:14 +08:00 分级别呗,就拿错误日志来说,单条日志报警 L2 晚上不管就行,10 分钟内的错误日志超过多少阈值 比如 1 万条,算 L1, 30 分钟内响应, 实例挂了无限重启 L0 ,5 分钟内响应 |
7 MeiJiayun 2024-12-29 16:56:08 +08:00 via iPhone 值班到夜间 12 点多,就不管告警了,除非业务人员打电话,第二天白天到公司上班再继续处理 |