
我这里说的是请求到达 nginx 的时间,而 nginx 的 log 里只能输出请求完成时的时间(或者说是输出日志那个时间点的时间
这个时间真的挺重要的,当请求量大服务器响应缓慢的时候,log 里输出的时间和请求实际到达服务器的时间根本不是一回事。想分析下具体流量怎么冲过来的都麻烦死,要先对 log 做预处理,用请求完成时间减去记录的请求时长,反过来计算出到达时间(而且这算出来到底靠不靠谱心理还没底)
分析生产环境的 nginx 日志到心态烦躁,抱怨下
1 ch2 2021-04-14 18:08:00 +08:00 api 网关了解一下 |
2 BeautifulSoap OP @ch2 又不是微服务 |
3 lcdtyph 2021-04-14 18:47:15 +08:00 via iPhone nginx 还有个 request_time 吧,好像是处理请求的总时间,减一减看 |
4 BeautifulSoap OP |
5 eason1874 2021-04-14 19:23:45 +08:00 $request_time 不能确定业务响应时间。 把业务配置成 upstream,然后可以用这三个来确定业务时间: $upstream_connect_time $upstream_header_time $upstream_response_time |
6 Kasumi20 2021-04-14 19:40:40 +08:00 上游 web 服务不会自己记录吗?又差不了多少 |
7 catchexception 2021-04-14 19:42:37 +08:00 建议使用 openresty,写 lua 扩展 |
8 0ZXYDDu796nVCFxq 2021-04-14 19:59:25 +08:00 via Android 在路上只有手机没法验证 盲猜在 server 里加一个 set $start_time $time_iso8601; 可以增加一个变量记录请求开始时间 |
9 Citrus 2021-04-14 20:01:06 +08:00 log_by_lua 想怎么算怎么算,可以把你想要的时间全打出来。 |
10 BeautifulSoap OP @Kasumi20 所以这和 nginx 不能记录到达时间有任何关系吗?所有 nginc 都有上游? 顺便生产环境上游是 aws 的 load balancer,再上面是 cloudfront,这两服务查起 log 更麻烦。服务跑在 aws 的 ecs 集群里 |
11 ryd994 2021-04-14 20:49:49 +08:00 via Android 因为 logging 是 Nginx 处理请求里最后一个阶段 楼上说的 set 可以试试看。因为 set 是 echo module 实现的,在 rewrite phase 。 参考 https://gist.github.com/denji/9130d1c95e350c58bc50e4b3a9e29bf4 |
12 ihipop 2021-04-14 21:17:44 +08:00 via Android @BeautifulSoap @BeautifulSoap API 网关又不是只能微服务。。。 |
13 BeautifulSoap OP |
14 datongkaze 2021-04-14 22:05:05 +08:00 可以说是很硬核了,学习了 |
15 wangritian 2021-04-15 09:33:42 +08:00 tcpdump 呗,抓几分钟的包拿到本机 wireshark 慢慢看 |
16 BeautifulSoap OP @wangritian 生产环境运行在 aws 的 ecs 上不可能让你去抓包 |