如何工程化计算搜索准确率和召回率? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yongzhong
V2EX    问与答

如何工程化计算搜索准确率和召回率?

  •  
  •   yongzhong 2021-02-20 11:10:32 +08:00 1689 次点击
    这是一个创建于 1725 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近在调研工程化计算搜索准召率相关的东西,无奈相关资料太少,目前只了解到人工标记以及 A/B test 的方式

    网上搜了一番后知道阿里有个搜索问题排查平台,但不知道具体是什么样的功能和实现

    有了解这方面的大佬指点一下吗
    10 条回复    2021-02-20 17:04:26 +08:00
    jdhao
        1
    jdhao  
       2021-02-20 11:12:54 +08:00 via Android
    什么叫“工程化计算准召率”?和通常定义的准召率有区别?
    yongzhong
        2
    yongzhong  
    OP
       2021-02-20 11:14:08 +08:00
    @jdhao #1 自动化,平台化,少人工介入的
    jdhao
        3
    jdhao  
       2021-02-20 11:16:31 +08:00 via Android
    没有人工,ground truth 不好判断
    yongzhong
        4
    yongzhong  
    OP
       2021-02-20 11:53:00 +08:00
    @jdhao 大佬一般用什么方法?
    jdhao
        5
    jdhao  
       2021-02-20 12:07:59 +08:00 via Android   1
    @yongzhong 没搞过自动化的,一般是抽样标注。然后再测试。
    p2pCoder
        6
    p2pCoder  
       2021-02-20 12:22:57 +08:00   1
    核心是把日志串起来
    在线的话直接把召回结果落盘,看覆盖和分布,然后召回结果与最终点击曝光的正负样本进行 join,进行分析
    movistar
        7
    movistar  
       2021-02-20 12:49:15 +08:00   1
    抽样加人工标注
    不过这样也就是评估一下准确率,召回率不好评估。
    在非给定集合内(用户生成的自然结果)去评估召回率,这个暂时没有什么好的评估方式。
    一般论文的准召率都是在给定候选集下评估出来的,什么 query 应该有什么结果是固定的,直接 diff 一下就知道效果。
    jr55475f112iz2tu
        8
    jr55475f112iz2tu  
       2021-02-20 13:04:37 +08:00   1
    理论上人工是无法完全排除的,只能转移,例如从供给方转移到使用方
    例如在搜索结果之后给个量表,让用户从 1 分到 5 分评价本次搜索结果的质量,当然不保证回收率
    LukeChien
        9
    LukeChien  
       2021-02-20 16:49:02 +08:00   1
    TimePPT
        10
    TimePPT  
    PRO
       2021-02-20 17:04:26 +08:00 via Android   1
    准召评测离不开人的,如果假定一段时间 Query 需求分布变化不大,可以只用一个高质量验证集打下效果就行。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5011 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 03:53 PVG 11:53 LAX 19:53 JFK 22:53
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86