meta 搞了很久搞出了 llama4, 为啥小米可以这么快搞定 mimo - V2EX
summerLast

meta 搞了很久搞出了 llama4, 为啥小米可以这么快搞定 mimo

  •  
  •   summerLast 2 days ago 2122 views

    国内人才储备量大? deepseek 改变了时间线,有作业抄?

    15 replies    2026-06-05 13:06:20 +08:00
    beimenjun
        1
    beimenjun  
    PRO
       2 days ago
    v2-pro 是 3/11 ,v2.5 是 4/22 ,算下来,考虑一下假期,差不多这个月 20 号,应该可以见到 mimo-v2.7 吧。
    murmur
        2
    murmur  
       2 days ago
    好像就是从 deepseek 挖的人,罗原来就是 deepseek 团队的
    Yanickkk
        3
    Yanickkk  
       2 days ago
    Deepseek 的存在,GLM5.1 的结构和 DeepSeek 几乎一样,只是在预训练和后训练上投入多点就可以获得不差的效果。架构带来的优势现在被拉平的不少,meta 的时代开源还没摸索出一个优秀的结构呢
    dingawm
        4
    dingawm  
       2 days ago
    meta 感觉主要还是之前组织比较混乱,调整后现在不是也有 muse spark 了,不过好像一般用户使用的还是比较少,也没啥声音说能力怎么样。
    lscho
        5
    lscho  
       2 days ago via Android
    因为 deepseek 每次开源之后写的技术报告太详细了,按照他的技术路线可以完全复现
    xuhengjs
        6
    xuhengjs  
       2 days ago
    所以粱圣伟大啊,这么好的东西就开源了。再加上蔡福莉也是在里头做了几个版本的。就好比你虽然不是主程,但也是项目里的高级程序了,把项目 copy 回去改改重新跑应该不难吧。难的是改方案,改架构。
    ndxxx
        7
    ndxxx  
       2 days ago via Android
    除了有 deepseek 的因素以外,meta 在 llama3 到 4 期间,ai 实验室经过了很多人事变动和办公室 drama 。

    多关注一下湾区的科技公司,你会发现科技圈的 drama 比洼地娱乐猪圈的 drama 有趣太多了
    iv8d
        8
    iv8d  
       2 days ago via Android
    第一国内卷,都是加班往前冲。第二可以蒸馏了啊。第三很多开源模型,照抄不会么
    smlcgx
        9
    smlcgx  
       2 days ago
    挖天才少女 1 是评估冷启动算力,2 是流量。小米别的不行,搞流量和抄作业还不会吗
    lzxz1234
        10
    lzxz1234  
       1 day ago
    所有看着最高端的技术、包括航天 原子弹 芯片看似门槛高难度大,实际最关键的只在那一两个人,之后才是团队和这一两个人能调动的资源,所以小米能造出来就比较容易解释了
    Seck
        11
    Seck  
       1 day ago
    学日本那一套

    国内厂商之间,不做技术壁垒,相互之间默认技术共享

    比如:云,国内押注云技术的只有阿里巴巴

    最后结果,到处都是云,阿里鸡毛钱没赚到

    亚马逊押注云,成功把云计算变成第一营收业务,阿里还是卖货的,人家变成了云计算公司,你滚来滚去还是靠电商

    相互之间技术共享都是默认的
    heyitsme
        12
    heyitsme  
       1 day ago
    招厉害的人,投足够多的钱,基于成熟的架构改巴改巴,就能做成国内 top 的水平,但是要做成世界级还需要长期深耕
    wangyang233
        13
    wangyang233  
       1 day ago
    要拿 mate 对比国内公司的话可以对比百度。。都是起了个大早啥也没弄出来的代表
    jingcoco
        14
    jingcoco  
       10h 21m ago
    我也问了半天 deepseek 这个问题; 问了半天 就是:
    ""
    领导力+吹牛+挖到关键人才+小米积累了很多数据+蒸馏+这个关乎小米业务舍得砸钱..
    """
    反正 deepseek 回答得挺客气 我感觉肯定有不知道的内幕.
    summerLast
        15
    summerLast  
    OP
       8h 57m ago
    是 因为搞定训练数据和强化学习的数据反馈了吗?
    About     Help     Advertise     Blog     API     FAQ     Solana     2877 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 51ms UTC 14:04 PVG 22:04 LAX 07:04 JFK 10:04
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86