基于 ai 开发推荐系统的可行性? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 A 生成的内容
hahaha121
V2EX    程序员

基于 ai 开发推荐系统的可行性?

  •  
  •   hahaha121 271 天前 2973 次点击
    这是一个创建于 271 天前的主题,其中的信息可能已经有所发展或是发生改变。

    假设有 10W 的用户数据,每天浏览新闻,是否是可以通过把用户的 id 和用户看过的新闻记录给过去,然 ai 自动分析用户对那些种类的新闻更感兴趣?

    19 条回复    2025-01-13 18:54:06 +08:00
    woscaizi
        1
    woscaizi  
       271 天前
    今日头条是一款信息类互联网产品,它会基于数据挖掘的推荐引擎向用户推荐文章。它由中国互联网创业者张一鸣于 2012 年 3 月创建,于 2012 年 8 月发布第一个版本。
    hahaha121
        2
    hahaha121  
    OP
       271 天前
    @woscaizi 这种需要搭建数据分析后台技术栈有点多哦,我指的是直接用现有的通义之类的 ai 模型,然后之后得到推荐结果
    qiniu2025
        3
    qiniu2025  
       271 天前
    当然可以,但是很不可控,要控制 AI 按需要的方式推荐,还需要做很多工作,比如建立标签库,抖音给每个人都有 3000 个标签,训练专用的模型才能降低成本,用这些公开几十亿,几百亿参数的模型亏死
    hahaha121
        4
    hahaha121  
    OP
       271 天前
    @qiniu2025 亏死是指 token 太多吗? 每个人 3000 个标签,是啥玩意好奇
    ns09005264
        5
    ns09005264  
       271 天前   1
    如果标签系统好的话,推荐系统用不上昂贵的模型就能有好的效果。
    所以可以在源头上使用昂贵的模型对文章或视频进行标签分析,建立完善的标签系统,剩下的就可以用廉价的模型进行推荐。
    Solix
        6
    Solix  
       271 天前 via iPhone
    可以是可以,花的 token 估计不是一般的多
    hahaha121
        7
    hahaha121  
    OP
       271 天前
    @ns09005264 好主意,成本巨降;
    hahaha121
        8
    hahaha121  
    OP
       271 天前
    @gaobh 数据格式提前做压缩,压缩成特地的协议好的简化格式可以省一点,但可能扩展性不高; 5L 的方案感觉非常完美
    R4rvZ6agNVWr56V0
        9
    R4rvZ6agNVWr56V0  
       271 天前
    @woscaizi 最早最算法推荐的不是张一鸣的今日头条,而是郑钧的玩聚 sr ,那会儿大概是 2008 年左右。
    huluhulu
        10
    huluhulu  
       271 天前   1
    别把现在的 AI 神话,不过是 LLM 、AIGC 而已。
    做这种事情,用数据挖掘/ML 之类的推荐系统足够了,效果比 LLM 好多了,成本还省很多。
    要了解 LLM 的边界。
    musi
        11
    musi  
       271 天前
    v2 现在的标签也是由大模型驱动了,你可以去搜一下 livid 发的帖子
    Yadomin
        12
    Yadomin  
       271 天前
    这不就是最新最热的 Generative Recommendation 吗
    w568w
        13
    w568w  
       271 天前
    这个想法早在 LLM 刚流行那年就被研究烂了,结论是系统更重要。LLM 在系统中的地位固然重要,但系统设计本身和 LLM 其实没有太大关系,反而要为了 LLM 做出许多妥协(例如输入不能太长,输出要经过校验,优化硬件满足实时性要求等等)。
    woscaizi
        14
    woscaizi  
       271 天前
    @GeekGa 郑昀-玩聚 SR 貌似和个性化推荐不一样
    murmur
        15
    murmur  
       271 天前
    推荐系统核心算法 :selelect title,content,author from articles order by paid_money desc
    murmur
        16
    murmur  
       271 天前
    你这个东西有点悖论,就是新闻是没法推荐的,因为新闻的发生不以用户的主管爱好为转移,除非是编造的假新闻和洗稿新闻

    比如我喜欢看美国着火,美国枪击,这事即便是美国也不够我看的啊
    R4rvZ6agNVWr56V0
        17
    R4rvZ6agNVWr56V0  
       271 天前
    @woscaizi 非要说算法那肯定不一样(具体你可以看看他博客的历史存档),但是效果是差不多的。只是那会儿没有移动端。相比头条收集信息的维度少(例如性别、LBS 数据),底线更高,只推荐全网大 v 的内容,而非头条系杂七杂八的自媒体小黄文
    RealMan
        18
    RealMan  
       271 天前
    LLM 和推荐系统的结合一直都很火,我自己也是研究相关方向的。现在比较认可的方向是生成式推荐和对话式推荐,和用户的多轮对话,不断捕获用户兴趣,生成跟用户兴趣相关的推荐产品。和传统推荐系统是互相促进的关系,不是取代。
    neptuno
        19
    neptuno  
       270 天前
    术业有专攻,你可以按照大模型技术栈训练一个推荐系统,而不是调用 api
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5636 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 07:54 PVG 15:54 LAX 00:54 JFK 03:54
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86