小米 mino v2 flash 套壳谷歌模型 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
coconutwater
V2EX    程序员

小米 mino v2 flash 套壳谷歌模型

  •  
  •   coconutwater 1 天前 7515 次点击

    https://i.imgur.com/F4y0Bsk.png

    所以应该是套壳吧,提示词都没写好

    第 1 条附言    1 天前
    经过 v 友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳:
    "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”即使用更强的模型( Gemini 、OpenAI )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"
    第 2 条附言    1 天前
    确实是 op 的问题,标题党了,新进来的建议直接退出,实在看不顺眼的点个 block 吧,实在抱歉。
    77 条回复    2025-12-26 08:09:47 +08:00
    orrinex
        1
    orrinex  
       1 天前
    大模型本来就是这样的吧......
    Kale
        2
    Kale  
       1 天前
    蒸馏。。
    Hilong
        3
    Hilong  
       1 天前
    大模型都出来多久了还能问出这种问题.他们俩是一个东西吗,那个推理速度也不是一个层级的啊
    coconutwater
        4
    coconutwater  
    OP
       1 天前
    @orrinex #1 试了其他几家的,都没有出现这种问题。并且目前依然可以复现"你爸爸是谁"
    si1enceneo
        5
    si1enceneo  
       1 天前   26
    快 2026 年了还在问这种问题,挺无语的
    coconutwater
        6
    coconutwater  
    OP
       1 天前
    smallparking
        7
    smallparking  
       1 天前 via Android   5
    闭源也能套壳吗?我们小米太牛逼了
    miniliuke
        8
    miniliuke  
       1 天前   15
    谷歌又没开源,怎么套
    tsja
        9
    tsja  
       1 天前
    和 DeepSeek 一样是基于主流大模型训练和蒸馏的,DeepSeek 刚出来的时候也一堆人问你是不是 openai ,也能得到肯定的回答。不管技术路径如何,小米赶紧基于此把弱智的小爱提升一下 AI 能力吧
    Yjhenan
        10
    Yjhenan  
       1 天前
    数据不都是蒸馏出来吗还是怎么着,反正各大模型都有这毛病
    cryptovae
        11
    cryptovae  
       1 天前
    小米罗福莉前 DeepSeek 研究员,加上上面说的,还不懂吗
    yhxx
        12
    yhxx  
       1 天前   1
    @miniliuke 哈哈哈哈 iframe
    keethebest
        13
    keethebest  
       1 天前   1
    很正常啊 训练数据问题 以前 gimini 还说自己是百度的模型呢
    brazz
        14
    brazz  
       1 天前
    好像没复现出来 https://aistudio.xiaomimimo.com/
    iorilu
        15
    iorilu  
       1 天前
    小米要能有 flash 水平, 早吹起来了
    coconutwater
        16
    coconutwater  
    OP
       1 天前
    @brazz #14 我是直接接入的 api 调用
    dhb233
        17
    dhb233  
       1 天前
    哪怕看你的图,也说明不了是谷歌的模型啊,transformer 本来就是所有 AI 的基础啊。
    coconutwater
        18
    coconutwater  
    OP
       1 天前
    经过 v 友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳:
    "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”即使用更强的模型(如 Google 的 Gemini 、OpenAI 的 GPT-4 )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"
    Gondolier
        19
    Gondolier  
       1 天前
    @tsja 这倒是真的。同样的苹果的 Apple Intelligence 也很弱智
    tanranran
        20
    tanranran  
       1 天前   1
    开源的东西,以小米的风评,要是真套壳,早就全网讨伐了
    Lisa9527
        21
    Lisa9527  
       1 天前
    还没训练彻底,半成品吧
    MartinYANG06
        22
    MartinYANG06  
       1 天前
    开始的时候谷歌的模型也说自己是千问、llama 、chatgpt , 说明小米模型的训练数据里用过其他模型的蒸馏数据,然后模型自我认知没有矫正,一开始 Gemini 也是这样的, 兄弟发帖之前最好先百度或者谷歌一下好吧。
    imokkkk
        23
    imokkkk  
       1 天前
    怎么还有人问这种问题,人家上市公司,小米又自带流量 buff ,你觉得可能吗
    fkdtz
        24
    fkdtz  
       1 天前
    @yhxx 真就字面意思
    majiajia
        25
    majiajia  
       1 天前   1
    @coconutwater #6 这不是你一直在提雷军吗
    cyp0633
        26
    cyp0633  
       1 天前
    有这么好的事?小米套出来 Gemini 的 API 给大家免费用?那赶紧冲啊
    xFrye
        27
    xFrye  
       1 天前   2
    实在搞不懂为啥有些人看到个新模型,第一时间是问他 ai 的爸爸是谁之类的无聊问题
    boringwheat
        28
    boringwheat  
       1 天前   22
    建议拉黑这类标题党,如果你不确定,你可以问“为什么 mino v2 flash 会自称来自 Gemini ?”而不是一开始起一个耸人听闻的标题,再假模假样的解释,因为这种行为在我眼里只有引战的效果
    issakchill
        29
    issakchill  
       1 天前   1
    不止见过一次这样的言论了。。都快 2026 了 还用“你是谁”来让模型回答自己是啥模型。。
    MIUIOS
        30
    MIUIOS  
       23 小时 59 分钟前   1
    v2ex 已经不是技术论坛了,纯水论坛,搬屎大论坛,啥人都可以搬屎上来
    MIUIOS
        31
    MIUIOS  
       23 小时 57 分钟前
    现在的模型基本都做蒸馏,甚至有可能还共用一套数据集,我每次看到小白去问 ai 你是谁你是什么模型这种问题就觉得好笑。

    LLM 模型根本没有自己的思维,他只是一个生成式的 AI ,讲大白话就是组词器,前词组后词,词哪里来,不也是训练的数据集。
    zhengluqing13
        32
    zhengluqing13  
       23 小时 55 分钟前 via Android
    评论区一堆神人懂王
    MIUIOS
        33
    MIUIOS  
       23 小时 46 分钟前
    @zhengluqing13 讲讲你的见解
    coconutwater
        34
    coconutwater  
    OP
       23 小时 42 分钟前   1
    IlIl
        35
    IlIl  
       23 小时 29 分钟前   1
    雷子大善人 免费给我们用 Gemini 的 api 雷门
    xeneizes
        36
    xeneizes  
       23 小时 28 分钟前
    真套壳的只有盘古套壳 qwen 吧,毕竟这个是内部人员爆料的
    lijintapx
        37
    lijintapx  
       23 小时 24 分钟前   4
    你的求知精神值得肯定,但是探索过程有些低能(客观描述
    argentea
        38
    argentea  
       23 小时 22 分钟前   2
    蒸馏其它大模型的数据没啥好喷的,也算是一种节约资源,大家都从头开始训练大模型的话先不说显卡和储存要涨价多少,光电就不知道要多耗费多少
    lijintapx
        39
    lijintapx  
       23 小时 21 分钟前
    @miniliuke 雷子一个心灵控制抓出 Google 老总的脑子强制他们交出代码完成套壳。
    ninja543
        40
    ninja543  
       23 小时 16 分钟前
    套不套不知道,但是论坛里面米粉蛮多的
    izToDo
        41
    izToDo  
       23 小时 14 分钟前   3
    @ninja543 你和之前帖子里说果粉多的打一架吧,话都被你们说完了
    DeYiAo
        42
    DeYiAo  
       23 小时 14 分钟前   3
    v 站上 v 友还算是有头脑可以反思的,看到好几个黑小米的帖子了,最后 lz 都能承认表示论据确实有问题。 很多年龄大的社区里,天天转发各种无脑黑的信息,解释了还不听,反而是:就算我转的是谣言,小米就没问题吗?
    nrtEBH
        43
    nrtEBH  
       23 小时 9 分钟前
    结婚 3 个月就生娃 能正常吗
    talk is cheap , show me your arXiv link
    brookegas
        44
    brookegas  
       23 小时 8 分钟前
    看到现在 Mi 被围殴得狼狈不堪,拍马赶来踩一脚蹭下热度,没想到翻车了
    jonty
        45
    jonty  
       23 小时 0 分钟前
    我不会 b 你,但是我会给你加个 tag 。
    horizon
        46
    horizon  
       22 小时 42 分钟前
    2023 年你有这个疑问还情有可原
    但是现在 2025 了。。。
    dabinDev
        47
    dabinDev  
       22 小时 41 分钟前
    mdzz
    1351161572
        48
    1351161572  
       22 小时 31 分钟前
    大模型月经贴
    javapythongo
        49
    javapythongo  
       22 小时 31 分钟前
    是不是被某家的千亿营销洗脑了
    cheese
        50
    cheese  
       22 小时 13 分钟前
    技术论坛,就算不做大模型,也好歹跟上技术认知。2025 年了,连蒸馏都没听过,还在问你爸爸是谁。
    在小米 AI 出来前你真的用过 AI 吗?
    离奇的好笑
    ShadowPower
        51
    ShadowPower  
       21 小时 47 分钟前
    2023 年那会还说谷歌模型抄袭百度文心一言呢

    一些小知识:
    LLM 模型训练出来之后并不知道自己是谁训练的,自己叫什么名字
    通过系统提示词,或者监督微调,可以让模型知道自己是谁训练的,叫什么名字
    上面那一步操作,会影响模型在其他方面的性能
    dragondove
        52
    dragondove  
       21 小时 35 分钟前
    怀疑楼主是不是程序员了,怎么感觉连开源都没接触过,难绷
    skiy
        53
    skiy  
       21 小时 30 分钟前
    估计 op 也没啥有用的知识分享了。已 block 。
    ccpp132
        54
    ccpp132  
       21 小时 24 分钟前
    这甚至都不能说明他用了 gemini 做蒸馏。因为训练大模型也不会特意说训练材料里加入你是谁,是谁训练的。你问大模型,他不知道自己是谁,他只会从语料里找一个会训练大模型的来编回答
    kylesean
        55
    kylesean  
       21 小时 22 分钟前
    这个模型很烂,工具调用都调用不明白,在我的 agent 里,会把 skills 解析成工具调用,导致输出错误的 xml 格式。其他模型都测试了国产的,gpt 的,都没有,就它有。
    shine1996
        56
    shine1996  
       21 小时 7 分钟前
    v2 人均大模型开发专家
    maomaosang
        57
    maomaosang  
       21 小时 4 分钟前   1
    「实在抱歉」
    给楼主点赞,楼主讲究人儿,知错能道歉。
    royzxq
        58
    royzxq  
       20 小时 41 分钟前
    小米要是真套壳你猜第二天千亿营销费用是不是已经上了
    JYii
        59
    JYii  
       20 小时 37 分钟前   2
    你对这个问题认知不足,这是小问题。你能道歉,这根本不是问题了。
    tinydancer
        60
    tinydancer  
       20 小时 36 分钟前   1
    @shine1996 这种问题属于大模型入门级问题,并不需要大模型专家才能理解和回答,能问出这种问题说明连大模型的门都没有摸到
    furch
        61
    furch  
       20 小时 21 分钟前
    只能说小米活做的糙,套壳是不可能的,不过符合小米一贯风格
    gpt5
        62
    gpt5  
       20 小时 16 分钟前   1
    不死犟到底的 v 友,不多了。
    duanxianze
        63
    duanxianze  
       19 小时 54 分钟前
    既然你会用 AI 了,还特意用了小米的 AI ,消息不该这么闭塞的,很奇怪
    back0893
        64
    back0893  
       19 小时 41 分钟前
    又来?
    虽然我不喜欢小米 但是你可以换个方向黑
    lance07
        65
    lance07  
       19 小时 23 分钟前
    新时代没有载你的船了
    aduangduang
        66
    aduangduang  
       18 小时 42 分钟前
    很好奇,黑小米真的能得到快乐吗?还是这种行为能让你有优越感?(当然如果有人真的给钱,那请务必带上我一起!)
    如果是华为的模型,我猜你又要赢 800 次了
    xzl
        67
    xzl  
       17 小时 48 分钟前   1
    这个建议还是自己删帖或者版主删帖吧,没必要为了黑而黑。
    Rickkkkkkk
        68
    Rickkkkkkk  
       17 小时 20 分钟前
    不如说小米套壳安卓,更合理点。
    MidCoder
        69
    MidCoder  
       17 小时 16 分钟前
    貌似还套壳了 Kimi ,应该是蒸馏了 Kimi 的数据
    might1
        70
    might1  
       17 小时 1 分钟前 via Android   1
    非常感谢 OP 提出问题,然后看回复,发现自己的问题,又总结了一下。我觉得挺好的。我不觉得这种问题没什么意义,反倒是挺有意义的。像我就不知道其中的原理。
    coconutwater
        71
    coconutwater  
    OP
       16 小时 51 分钟前
    @xzl #67 看了删帖规则,题主自身是删不了的
    zzlove
        72
    zzlove  
       16 小时 47 分钟前
    和这个帖子有什么区别?都在一个群领的任务?
    https://v2ex.com/t/1178410
    WuSiYu
        73
    WuSiYu  
       14 小时 49 分钟前
    现在所有 LLM 基本都是赛博人体蜈蚣
    Grefer
        74
    Grefer  
       14 小时 37 分钟前
    我还以为能上 V 站的人至少稍微懂点技术,没想到依旧能看到这种博眼球倒垃圾的贴子
    Linon
        75
    Linon  
       14 小时 36 分钟前 via Android
    你的帖子问题已经被 claude 解决了!https://f.pz.al/pzal/2025/12/25/498ddd4a80229.jpg
    billly
        76
    billly  
       5 小时 57 分钟前
    这都几年了,还能问出这种愚蠢的问题,还是在这里,服了
    MIUIOS
        77
    MIUIOS  
       2 小时 22 分钟前
    @maomaosang https://v2ex.com/t/1159316
    还洗呢,人家都知道去 huggingface 下模型部署,还不知道 llm 原理吗,大概率就是想黑一下小米,反正小米给人的映象就是啥都抄
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5496 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 37ms UTC 02:32 PVG 10:32 LAX 18:32 JFK 21:32
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86