震惊!知名 AI 大公司竟做出这种事…… - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
boboliu
V2EX    分享发现

震惊!知名 AI 大公司竟做出这种事……

  •  1
     
  •   boboliu 2024-06-28 17:04:44 +08:00 4738 次点击
    这是一个创建于 518 天前的主题,其中的信息可能已经有所发展或是发生改变。
    早晨看到 Gemma2 的跑分就觉得不对,里面llama3 那个 666 的 mmlu 太标志性了,抽空把这两个都跑了一遍 GSM-8K

    谷歌这宣传资料很明显是用自家微调过的模型打 llama3 的基础模型,脸都不要了

    全部 bench 都是原汁原味的 pytorch 运行,
    gemma2 发了个 f32 的 base 我还用 f32 跑的,慢的想死

    第 1 条附言    2024-06-28 18:00:01 +08:00
    https://storage.googleapis.com/deepmind-media/gemma/gemma-2-report.pdf

    有人跟我说谷歌在 report 里面有说是不是预训练模型成绩,我有点困了没找到,请诸君看一下吧
    8 条回复    2024-07-28 16:14:55 +08:00
    luckykong
        1
    luckykong  
       2024-06-28 17:34:47 +08:00
    厉害,这事做的,都不知道该如何评价了
    hantianyang
        2
    hantianyang  
       2024-06-28 17:40:09 +08:00
    nb
    Donaldo
        3
    Donaldo  
       2024-06-28 17:42:29 +08:00
    大厂嘛,不稀奇。。
    kaichen
        4
    kaichen  
    PRO
       2024-06-28 18:39:31 +08:00
    他这里有 5-shot 的标注耶,应该是没公开 prompt 的情况吧
    boboliu
        5
    boboliu  
    OP
       2024-06-29 22:17:57 +08:00
    @kaichen 没有,5shot maj@1 本来就是 gsm-8k 常规的评估方法,即使受随机 icl 样本的影响,分数影响也不应该这么大
    NoOneNoBody
        6
    NoOneNoBody  
       2024-07-08 16:54:44 +08:00
    9 天前没热度的帖子,怎么还置顶起来了?
    boboliu
        7
    boboliu  
    OP
       2024-07-08 17:24:16 +08:00
    @NoOneNoBody 因为看到了 /t/1055707 ,突然想起来我也想吐槽谷歌,顺手顶一下
    yinmin
        8
    yinmin  
       2024-07-28 16:14:55 +08:00
    Gemma2 9B 的翻译、文字总结不错。毕竟只有 9B ,STEM 类的肯定不行。Gemma2 9B 对硬件要求也不高,能部署在个人 PC 上。

    在不连 Internet 的内网自己架一个私人 AI ,装上 Gemma2 9B 和 Qwen2 7B 处理些文字类、翻译类的工作,还是蛮好的。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2691 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 07:54 PVG 15:54 LAX 23:54 JFK 02:54
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86