Cloudflare 网站监测跟其它监测工具的监测结果差异这么大么? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dbzz
V2EX    Cloudflare

Cloudflare 网站监测跟其它监测工具的监测结果差异这么大么?

  •  
  •   dbzz 2023-12-20 00:59:51 +08:00 4818 次点击
    这是一个创建于 710 天前的主题,其中的信息可能已经有所发展或是发生改变。

    先上网站地址(一个租房工具网站): https://dbzz.house/
    网站放在 Cloudflare 上,也尽量使用了 Cloudflare 的工具,包括域名、DNS 、Cache 、HTTS 证书、WAF 等。
    Cloudflare 有个 Analytics & Logs 工具,提供了基础的网站监测功能,主要是 PV 、UV 、Bandwith 这些。

    自己另外加了些监测工具,主流的应该都加了:GA4(Google Analytics 4)、Piwik 、百度统计、51.la

    不同家的监测结果有些差异。比如,无论 PV/UV ,51.la 的数据都是最少的,而 Cloudflare 是最多的。
    同时 Cloudflare 的数据跟其它家数据差异最大,以 2023.12.18 的数据为例,Cloudflare 统计的 UV 是第二名( Piwik )统计 UV 的 4.3 倍,PV 是第二名( GA4 )统计到的 17 倍。肉眼看其它天数据,感觉大同小异。

    之前以为可能是 cache 的原因,用户的浏览器缓存没有更新,导致监测代码没有统计到这部分用户。但后来看了下,Cloudflare 上配置的 Browser Cache TTL 是 4h ,没改过。
    自己手动测试访问一些 URL ,在各家的后台访问明细里都能看到。

    个人猜测,可能是 Cloudflare 统计多了,毕竟其它家的统计结果差异没有那么大。
    求各位给分析下,可能是啥原因呢?
    谢谢大家。

    27 条回复    2023-12-23 10:38:58 +08:00
    xmoer
        1
    xmoer  
       2023-12-20 01:04:47 +08:00   2
    第三方统计的 js 代码普遍会被各种 AdBlock 插件拦截,故偏少是正常的,我觉得反而 CF 这个更准。
    dbzz
        2
    dbzz  
    OP
       2023-12-20 01:21:58 +08:00
    @xmoer 没理解。各种 AdBlock 插件不是要拦截广告的么,为啥要拦截 JS 统计代码呢?
    Saniter
        3
    Saniter  
       2023-12-20 01:56:56 +08:00   1
    adblock 拦截统计 js 不是常规操作吗
    jinliming2
        4
    jinliming2  
       2023-12-20 02:07:31 +08:00 via iPhone   1
    @dbzz 因为第三方的访问统计被认为是一种隐私泄漏(这一点每个人观点不同)。
    第三方的统计拿到数据之后,可以精准的分析用户在各个网站上的行为,用于精准地推送广告之类的。
    所以广告屏蔽第三方统计都是常规操作了,不过大部分都有设置可以选择不屏蔽。
    yyfearth
        5
    yyfearth  
       2023-12-20 02:50:49 +08:00   1
    @dbzz 这类扩展都默认屏蔽了这些 js 代码的加载
    一般的用户谁会手动去改这些
    airyland
        6
    airyland  
       2023-12-20 03:6:33 +08:00   1
    cf 有两个统计:
    1. Account Analytics 基本会是其他工具几倍以上的数据,因为它不是页面统计,而是在服务器端统计了所有请求。
    2. Web Analytics 这个仅统计页面请求,会相比其他多一点,但不会太离谱。
    estk
        7
    estk  
       2023-12-20 07:20:11 +08:00 via iPhone   1
    Cloudflare 的统计在 js 加载出来之前就可以做到
    其它统计需要等 js 加载完成,然后上报
    tailf
        8
    tailf  
       2023-12-20 09:18:39 +08:00   1
    服务器日志里面,大部分的请求其实都是搜索引擎爬虫发出的
    Shiroka
        9
    Shiroka  
       2023-12-20 09:24:58 +08:00 via iPhone   1
    Cloudflare 统计的是它收到的所有请求,你在某台服务器上 curl 好几次,它就会统计成好几个 PV ,所以有些搜索引擎的爬虫或者播测平台的测试请求都会被算入。

    其他依赖 js 的统计,比如 GA 和 cnzz 是需要访客加载出来那个 js ,然后再回传数据的,这个爬虫和攻击一般做不到,通常还是真实访客居多。

    所以 Cloudflare 比 GA 多的那一部分大概率是非人类用户产生的,不知道楼主能不能理解。
    bingo084
        10
    bingo084  
       2023-12-20 10:21:10 +08:00   1
    别的不说,你这个租房工具网站挺方便的
    deBaikal
        11
    deBaikal  
       2023-12-20 10:34:18 +08:00   1
    工具挺方便的 赞一个
    lizhenda
        12
    lizhenda  
       2023-12-20 11:07:16 +08:00
    cf 速度这么快的吗,不管代不代理,都是秒开啊
    7inFen
        13
    7inFen  
       2023-12-20 11:18:32 +08:00   1
    ![6a154a31cf63ff71af394901fe646097.jpeg]( https://i.miji.bid/2023/12/20/6a154a31cf63ff71af394901fe646097.jpeg)

    基本都被屏蔽了
    admpubcom
        14
    admpubcom  
       2023-12-20 11:39:02 +08:00 via iPhone   1
    页面上加的统计主要统计浏览器环境下的网页行为,无法统计类似于 curl 直接请求网页本身的行为
    ShuA1
        15
    ShuA1  
       2023-12-20 12:20:09 +08:00   1
    cf 的统计是基于四层流量的, 更准确
    samhjn
        16
    samhjn  
       2023-12-20 14:01:29 +08:00 via iPhone   1
    有一些爬虫不会解析 JS ,这个也可能是一部分差量
    sudoy
        17
    sudoy  
       2023-12-20 14:49:59 +08:00
    有没有可能,楼主其实是来宣传网站的 手动狗头
    dbzz
        18
    dbzz  
    OP
       2023-12-20 17:41:01 +08:00
    @Shiroka 听起来 make sense 。另外,播测平台是指?
    dbzz
        19
    dbzz  
    OP
       2023-12-20 17:44:48 +08:00
    @lizhenda 是不是你的网络环境比较好?
    CF 套在境内网站应该是负优化,我的 VPS 是 AWS Lightsail 东京机房。
    dbzz
        20
    dbzz  
    OP
       2023-12-20 17:46:26 +08:00
    @sudoy 出发点真的是来问问题的,困惑了好几天……客观上应该会有些宣传效果。
    dbzz
        21
    dbzz  
    OP
       2023-12-20 17:48:11 +08:00
    @ShuA1 专业啊,高屋建瓴。
    drymonfidelia
        22
    drymonfidelia  
       2023-12-20 21:30:49 +08:00
    @ShuA1 我们说的访问量都是指真实用户的 脚本的不算
    ShallowAi
        23
    ShallowAi  
       2023-12-20 21:33:49 +08:00 via Android   1
    大多数广告屏蔽都默认屏蔽这些监听 js ,另外爬虫也不加载 js 。cloudflare 的结果数据会更多一些,你这个网站是面向国内用户的,那么 cf 的分析中其他区域的访问你都可以默认是爬虫。另外还是少加一点统计,一般百度统计+GA 就覆盖全了。
    dbzz
        24
    dbzz  
    OP
       2023-12-20 21:43:32 +08:00
    @airyland 谢谢。
    我之前没留意到 CF 还有 Account Analytics ,我前面说的是 Web Analytics 。
    dbzz
        25
    dbzz  
    OP
       2023-12-20 23:45:34 +08:00
    @7inFen 谢谢。
    老哥,求问下你这里装的是什么 block 插件啊,我的 Chrome 也装了两个,但并没有拦截。
    7inFen
        26
    7inFen  
       2023-12-21 10:18:17 +08:00   1
    @dbzz AdGuard ,我把广告和隐私过滤都打开了,还有这个 https://github.com/Loyalsoldier/clash-rules ,也会拦截
    sudoy
        27
    sudoy  
       2023-12-23 10:38:58 +08:00
    @dbzz 哈哈开玩笑哈,网站确实不错,挺实用
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2803 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 02:54 PVG 10:54 LAX 18:54 JFK 21:54
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86