rt,小弟目前要做一个基于 starRocks 的路径分析功能,参考火山引擎/神策数据,但是这两个平台没有展示 sql ,小弟感觉有点难以下手。
目前的思路是: 1 、首先要做到会话识别,通过窗口函数等操作将数据划分为一个个的会话 2 、从这个会话上识别出路径,然后 group by 统计信息等
上面的思路目前还是很模糊,有木有搞过的大佬享下经验,万分感谢
1 pppwww OP 手抖点错了,删掉删掉 |
![]() | 2 Jim2Chen 247 天前 有思路了没?学习一下 |
5 pppwww OP @Jim2Chen 有空了写个文章分享下,目前整理的方案和公司的数据结合的比较多,不方便直接发,主要步骤就是: 1 、如何识别会话 通过窗口函数,计算相邻两次行为的时间间隔,按照规定的 sessionPeriod 切割会话 2 、识别会话后,如何实现路径的裁剪 通过窗口函数,找到路径的起始或者结束节点,然后进行一次裁剪 再次通过窗口函数,对每个会话的行为节点编号,进行一次深度上的裁剪 3 、最终返回给展示层的数据格式 这里有两种返回形式,一种是直接返回路径,然后业务层做计算,另一种是返回节点对之间的统计信息。可以根据业务需求自由选择 |
6 superliy 228 天前 StarRocks 好用吗 |