比如我想基于 ansible-playbook 去做 nginx 的重启操作,核心操作执行的是 systemctl restart nginx,那么我怎么能判断我重启完了 nginx 后 nginx 是运行正常的? nginx 这个中间件和重启这个运维操作都是个例子,运维操作可能是停止、启动、重载配置等等,中间件不只是 nginx,可能是 kafka 、apache 、zk 等等,其实就是在不改中间件源码的情况下,能通过一些外部对中间件的观测手段(进程、端口、日志等等)去判断我的操作是达到预期结果的?我想了一下可能是日志好一些,但是日志报警可能时效性低一些?
![]() | 1 wellsc 2021-06-24 21:29:49 +08:00 via iPhone healthcheck 呗,原理你自己也说了,无非就是网络或者进程 |
2 js8510 2021-06-25 02:58:44 +08:00 我很好奇。。为什么不能改代码?加个心跳接口? |
![]() | 3 frankchen 2021-06-25 10:11:47 +08:00 promethus expoter ,在加个告警 |
![]() | 4 zhoudaiyu OP PRO |
![]() | 6 KaynW 2021-06-25 11:23:11 +08:00 这玩意不都是 healthcheck 或者 readycheck 吗, 是不是指标没选好 |
![]() | 7 iwishing 2021-06-25 17:11:04 +08:00 重启 nginx 不应该是 nginx -s reload 吗? 你的方法就直接判断 systemctl status nginx 状态就好了啊 |