老哥们,作为程序员,业务晚上会报警,自己一个人还好,影响家里人休息,大家咋处理的。
![]() | 1 johnchshen 2020-06-15 14:23:51 +08:00 via Android 电脑、资料不在身边,麻烦分析日志、服务器状态。编写 bug 报告。方便次日分析处理。 要求在测试环境重现。要重新步骤手册,图文兼顾那种。 bug 报告模板可以在网上找,要求越高越好,越适合重现问题那种越好。 多来几次,业务就会自己分析问题和初步处理了。 |
![]() | 2 jinhan13789991 2020-06-15 14:30:23 +08:00 via Android ![]() 手机开飞行模式 |
![]() | 3 keepeye 2020-06-15 14:39:14 +08:00 ![]() 1.真有紧急情况还是要处理的,如果是你负责的。 2.不应当经常出现此类情况,应当努力避免发生。 |
4 sonice 2020-06-15 15:52:49 +08:00 告警也是有级别划分的啊,有人给打电话过来了就可以起床弄了,否则当没看见。 |
![]() | 5 cubecube 2020-06-15 15:58:04 +08:00 via Android 曾经,在某银行负责重要系统,几乎每天晚上告警,会被打电话叫起来,开机远程过去解决问题,半小时到一小时不等。 晚上八点多还打卡,干了半年,精神状态都不好了,离职了。 |
![]() | 6 wujieyuan 2020-06-15 16:00:13 +08:00 自己的负责的任务当然得尽快处理,特别是紧急的事情 |
8 tfdetang 2020-06-15 16:13:42 +08:00 @cubecube 握手,也弄过这样的项目,晚上要和清算所对账,一开始总有各种各样问题,对不上。 头一个月每天晚上 4-5 点都要被拉起来解决问题,然后早上还要去上班。 虽然一个月后基本就稳定了,不过很长一段时间都养成了一到对账的点就醒的习惯 |
![]() | 10 luckyrayyy 2020-06-15 16:41:55 +08:00 你要是问我,我肯定回答爬起来修复啊!!! 当然实际上我静音了,听不见。 |
11 chenmobuys 2020-06-15 16:44:15 +08:00 手机静音 |
![]() | 12 wzq001 2020-06-15 17:03:03 +08:00 @cubecube 关键在于还会有新坑出现,不可一直晚上救火啊!天大的事儿,第二天再说,让他长长记性,如果你这样一直加班搞,他会觉得理所应当,反正有人填坑~~~ PS:开发经理肯定有外包回扣的,所以,如果他分比例给你的话,也可以考虑,没利益,干毛线 |
![]() | 13 NauxLiu 2020-06-15 17:16:56 +08:00 ![]() 1. 给 alert 分优先级,比如 P1 是即使晚上也需要起床紧急修复的。P2/P3 等是只有邮件或 IM 通知,可以第二天再修复。 2. 轮班制,如果不是小公司,比如你们部门只有你一个人。那应该上轮班制度,大概每个人负责一周这样。 我们公司用的 Opsgenie,可以和各个平台集成,设置消息优先级和通知渠道,以及设定规则自动轮班。 |
![]() | 14 fishofcat OP 大佬们,说的对。第一没啥测试,第二没啥 backup 。静音的话没人处理了就。。。。。 |
15 cw2k13as 2020-06-15 17:49:08 +08:00 当没看见,一律上班处理 2333 |
![]() | 16 imbushuo 2020-06-15 19:13:08 +08:00 via iPhone ![]() 贵司 Ops 没自动化的么( - 能采取自动措施的就自动解决,如果自动解决失败就 escalate 到 oncall DRI - 多地运行,每个 region 内再分 shard,如果只是区域性问题的话就把所有 traffic 迁移到下一个可用区域,然后等到上班了再来处理 - Oncall 有 Primary 和 Secondary,多人一起备份 - 印度 /Sunnyvale/NYC 多个组一起 oncall shift,这样大家都能睡觉 |
18 threeEggs123 2020-06-15 21:55:39 +08:00 via Android ![]() 同事,oncall,关机没接,传到了上级领导,领导没接,最后打到了 VP 头上。同事直接被干掉。 |
![]() | 19 AngryPanda 2020-06-15 22:53:51 +08:00 via Android 手环可以不呢 |
![]() | 20 gitJavascript 2020-06-15 22:59:00 +08:00 暂停告警 |
21 shuangya 2020-06-15 23:18:02 +08:00 via Android 晚上告警当然还是要处理的。 但经常告警,那你就得分析分析怎么回事了。该优化代码优化,该加机器就加。这不是一个应该有的现象。 |
![]() | 22 Mac 2020-06-15 23:23:08 +08:00 via Android 手环 |
![]() | 23 levelworm 2020-06-15 23:30:31 +08:00 @threeEggs123 这公司不呆也蛮好的。。。 |
![]() | 24 Tonara 2020-06-15 23:42:12 +08:00 一路 ack 上去 |
25 vanityfairn 2020-06-16 00:51:30 +08:00 提高报警阈值,手动狗头~ 这样就看不到报警了 |
![]() | 26 d0v0b 2020-06-16 01:10:34 +08:00 我看到篇帖子说手机和 wifi 有辐射建议你睡觉断网关机(狗头) |
![]() | 28 ruanimal 2020-06-16 10:00:52 +08:00 招运维啊 |
![]() | 29 ZeoKarl 2020-06-16 10:10:07 +08:00 via iPhone 我表示睡着了也就地震和爆破可以把我震醒 |
30 NoKey 2020-06-16 10:13:36 +08:00 公司规定 24 小时待命,有报警多少小时内必须处理,等等 那就干这活,就得做这事呗 如果没规定。。。那你想怎么干怎么干。。。 |
![]() | 32 zxcslove 2020-06-16 10:45:52 +08:00 ![]() 传统单位都是设置值班岗位,还是 IT 企业会省钱 |
33 threeEggs123 2020-06-16 13:32:16 +08:00 via Android @levelworm 外企,工资又高,又不加班,只是倒霉,谁叫他没接电话呢,客户亏了钱,总得找个锅顶上? |
![]() | 34 levelworm 2020-06-16 20:00:58 +08:00 via Android @threeEggs123 这事情不处理领导么。。。 |
35 win7pro 2020-06-16 23:08:18 +08:00 戴耳机睡 |
![]() | 36 ivyliner 2020-06-17 14:09:50 +08:00 @fishofcat 可以买个小米手环, 会震动. 我是想早上自己早起, 买了个手环, 效果还可以. 你的场景下的话, 手机可以静音, 然后手环会在手机没有接的 5s 之后震动. |
![]() | 38 freelancher 2020-07-23 17:10:02 +08:00 我以前也老这样半夜醒。同事也是。后面都得心脏病了。 业务稀烂就要人肉顶。招个 24 小时值班团队就是了。没钱。呵呵。跑路。 |
![]() | 39 yupozhang 2022-06-23 19:28:49 +08:00 晚上的报警需要自动打电话啊。推荐一个推送助手,push .spug.cc |