V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
coconutwater
V2EX  ›  程序员

小米 mino v2 flash 套壳谷歌模型

  •  
  •   coconutwater · 15 小时 17 分钟前 · 6964 次点击

    https://i.imgur.com/F4y0Bsk.png

    所以应该是套壳吧,提示词都没写好

    第 1 条附言  ·  14 小时 46 分钟前
    经过 v 友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳:
    "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”——即使用更强的模型( Gemini 、OpenAI )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"
    第 2 条附言  ·  14 小时 22 分钟前
    确实是 op 的问题,标题党了,新进来的建议直接退出,实在看不顺眼的点个 block 吧,实在抱歉。
    75 条回复    2025-12-25 19:55:34 +08:00
    orrinex
        1
    orrinex  
       15 小时 14 分钟前
    大模型本来就是这样的吧......
    Kale
        2
    Kale  
       15 小时 14 分钟前
    蒸馏。。
    Hilong
        3
    Hilong  
       15 小时 13 分钟前
    大模型都出来多久了还能问出这种问题.他们俩是一个东西吗,那个推理速度也不是一个层级的啊
    coconutwater
        4
    coconutwater  
    OP
       15 小时 13 分钟前
    @orrinex #1 试了其他几家的,都没有出现这种问题。并且目前依然可以复现"你爸爸是谁"
    si1enceneo
        5
    si1enceneo  
       15 小时 10 分钟前   ❤️ 24
    快 2026 年了还在问这种问题,挺无语的
    coconutwater
        6
    coconutwater  
    OP
       15 小时 10 分钟前
    smallparking
        7
    smallparking  
       15 小时 10 分钟前 via Android   ❤️ 5
    闭源也能套壳吗?我们小米太牛逼了
    miniliuke
        8
    miniliuke  
       15 小时 10 分钟前   ❤️ 15
    谷歌又没开源,怎么套
    tsja
        9
    tsja  
       15 小时 8 分钟前
    和 DeepSeek 一样是基于主流大模型训练和蒸馏的,DeepSeek 刚出来的时候也一堆人问你是不是 openai ,也能得到肯定的回答。不管技术路径如何,小米赶紧基于此把弱智的小爱提升一下 AI 能力吧
    Yjhenan
        10
    Yjhenan  
       15 小时 7 分钟前
    数据不都是蒸馏出来吗还是怎么着,反正各大模型都有这毛病
    cryptovae
        11
    cryptovae  
       15 小时 6 分钟前
    小米罗福莉前 DeepSeek 研究员,加上上面说的,还不懂吗
    yhxx
        12
    yhxx  
       15 小时 6 分钟前   ❤️ 1
    @miniliuke 哈哈哈哈 iframe
    keethebest
        13
    keethebest  
       15 小时 6 分钟前   ❤️ 1
    很正常啊 训练数据问题 以前 gimini 还说自己是百度的模型呢
    brazz
        14
    brazz  
       15 小时 5 分钟前
    好像没复现出来 https://aistudio.xiaomimimo.com/
    iorilu
        15
    iorilu  
       15 小时 5 分钟前
    小米要能有 flash 水平, 早吹起来了
    coconutwater
        16
    coconutwater  
    OP
       15 小时 4 分钟前
    @brazz #14 我是直接接入的 api 调用
    dhb233
        17
    dhb233  
       15 小时 1 分钟前
    哪怕看你的图,也说明不了是谷歌的模型啊,transformer 本来就是所有 AI 的基础啊。
    coconutwater
        18
    coconutwater  
    OP
       14 小时 59 分钟前
    经过 v 友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳:
    "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”——即使用更强的模型(如 Google 的 Gemini 、OpenAI 的 GPT-4 )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"
    Gondolier
        19
    Gondolier  
       14 小时 56 分钟前
    @tsja 这倒是真的。同样的苹果的 Apple Intelligence 也很弱智
    tanranran
        20
    tanranran  
       14 小时 50 分钟前   ❤️ 1
    开源的东西,以小米的风评,要是真套壳,早就全网讨伐了
    Lisa9527
        21
    Lisa9527  
       14 小时 45 分钟前
    还没训练彻底,半成品吧
    MartinYANG06
        22
    MartinYANG06  
       14 小时 43 分钟前
    开始的时候谷歌的模型也说自己是千问、llama 、chatgpt , 说明小米模型的训练数据里用过其他模型的蒸馏数据,然后模型自我认知没有矫正,一开始 Gemini 也是这样的, 兄弟发帖之前最好先百度或者谷歌一下好吧。
    imokkkk
        23
    imokkkk  
       14 小时 43 分钟前
    怎么还有人问这种问题,人家上市公司,小米又自带流量 buff ,你觉得可能吗
    fkdtz
        24
    fkdtz  
       14 小时 40 分钟前
    @yhxx 真就字面意思
    majiajia
        25
    majiajia  
       14 小时 37 分钟前   ❤️ 1
    @coconutwater #6 这不是你一直在提雷军吗
    cyp0633
        26
    cyp0633  
       14 小时 36 分钟前
    有这么好的事?小米套出来 Gemini 的 API 给大家免费用?那赶紧冲啊
    xFrye
        27
    xFrye  
       14 小时 34 分钟前   ❤️ 2
    实在搞不懂为啥有些人看到个新模型,第一时间是问他 ai 的爸爸是谁之类的无聊问题
    boringwheat
        28
    boringwheat  
       14 小时 33 分钟前   ❤️ 21
    建议拉黑这类标题党,如果你不确定,你可以问“为什么 mino v2 flash 会自称来自 Gemini ?”而不是一开始起一个耸人听闻的标题,再假模假样的解释,因为这种行为在我眼里只有引战的效果
    issakchill
        29
    issakchill  
       14 小时 25 分钟前   ❤️ 1
    不止见过一次这样的言论了。。都快 2026 了 还用“你是谁”来让模型回答自己是啥模型。。
    MIUIOS
        30
    MIUIOS  
       14 小时 9 分钟前   ❤️ 1
    v2ex 已经不是技术论坛了,纯水论坛,搬屎大论坛🤭,啥人都可以搬屎上来
    MIUIOS
        31
    MIUIOS  
       14 小时 7 分钟前
    现在的模型基本都做蒸馏,甚至有可能还共用一套数据集,我每次看到小白去问 ai 你是谁你是什么模型这种问题就觉得好笑。

    LLM 模型根本没有自己的思维,他只是一个生成式的 AI ,讲大白话就是组词器,前词组后词,词哪里来,不也是训练的数据集。
    zhengluqing13
        32
    zhengluqing13  
       14 小时 5 分钟前 via Android
    评论区一堆神人懂王
    MIUIOS
        33
    MIUIOS  
       13 小时 56 分钟前
    @zhengluqing13 讲讲你的见解
    coconutwater
        34
    coconutwater  
    OP
       13 小时 53 分钟前   ❤️ 1
    IlIl
        35
    IlIl  
       13 小时 40 分钟前   ❤️ 1
    雷子大善人 免费给我们用 Gemini 的 api 雷门🙌
    xeneizes
        36
    xeneizes  
       13 小时 38 分钟前
    真套壳的只有盘古套壳 qwen 吧,毕竟这个是内部人员爆料的
    lijintapx
        37
    lijintapx  
       13 小时 35 分钟前   ❤️ 4
    你的求知精神值得肯定,但是探索过程有些低能(客观描述
    argentea
        38
    argentea  
       13 小时 32 分钟前   ❤️ 2
    蒸馏其它大模型的数据没啥好喷的,也算是一种节约资源,大家都从头开始训练大模型的话先不说显卡和储存要涨价多少,光电就不知道要多耗费多少
    lijintapx
        39
    lijintapx  
       13 小时 32 分钟前
    @miniliuke 雷子一个心灵控制抓出 Google 老总的脑子强制他们交出代码完成套壳。
    ninja543
        40
    ninja543  
       13 小时 26 分钟前
    套不套不知道,但是论坛里面米粉蛮多的
    izToDo
        41
    izToDo  
       13 小时 25 分钟前   ❤️ 3
    @ninja543 你和之前帖子里说果粉多的打一架吧,话都被你们说完了 😋
    DeYiAo
        42
    DeYiAo  
       13 小时 24 分钟前   ❤️ 2
    v 站上 v 友还算是有头脑可以反思的,看到好几个黑小米的帖子了,最后 lz 都能承认表示论据确实有问题。 很多年龄大的社区里,天天转发各种无脑黑的信息,解释了还不听,反而是:就算我转的是谣言,小米就没问题吗?
    nrtEBH
        43
    nrtEBH  
       13 小时 20 分钟前
    结婚 3 个月就生娃 能正常吗
    talk is cheap , show me your arXiv link
    brookegas
        44
    brookegas  
       13 小时 19 分钟前
    看到现在 Mi 被围殴得狼狈不堪,拍马赶来踩一脚蹭下热度,没想到翻车了 😏
    jonty
        45
    jonty  
       13 小时 11 分钟前
    我不会 b 你,但是我会给你加个 tag 。
    horizon
        46
    horizon  
       12 小时 52 分钟前
    2023 年你有这个疑问还情有可原
    但是现在 2025 了。。。
    dabinDev
        47
    dabinDev  
       12 小时 52 分钟前
    mdzz
    1351161572
        48
    1351161572  
       12 小时 42 分钟前
    大模型月经贴
    javapythongo
        49
    javapythongo  
       12 小时 41 分钟前
    是不是被某家的千亿营销洗脑了
    cheese
        50
    cheese  
       12 小时 24 分钟前
    技术论坛,就算不做大模型,也好歹跟上技术认知。2025 年了,连蒸馏都没听过,还在问你爸爸是谁。
    在小米 AI 出来前你真的用过 AI 吗?
    离奇的好笑
    ShadowPower
        51
    ShadowPower  
       11 小时 58 分钟前
    2023 年那会还说谷歌模型抄袭百度文心一言呢

    一些小知识:
    LLM 模型训练出来之后并不知道自己是谁训练的,自己叫什么名字
    通过系统提示词,或者监督微调,可以让模型知道自己是谁训练的,叫什么名字
    上面那一步操作,会影响模型在其他方面的性能
    dragondove
        52
    dragondove  
       11 小时 46 分钟前
    怀疑楼主是不是程序员了,怎么感觉连开源都没接触过,难绷
    skiy
        53
    skiy  
       11 小时 40 分钟前
    估计 op 也没啥有用的知识分享了。已 block 。
    ccpp132
        54
    ccpp132  
       11 小时 35 分钟前
    这甚至都不能说明他用了 gemini 做蒸馏。因为训练大模型也不会特意说训练材料里加入你是谁,是谁训练的。你问大模型,他不知道自己是谁,他只会从语料里找一个会训练大模型的来编回答
    kylesean
        55
    kylesean  
       11 小时 32 分钟前
    这个模型很烂,工具调用都调用不明白,在我的 agent 里,会把 skills 解析成工具调用,导致输出错误的 xml 格式。其他模型都测试了国产的,gpt 的,都没有,就它有。
    shine1996
        56
    shine1996  
       11 小时 18 分钟前
    v2 人均大模型开发专家
    maomaosang
        57
    maomaosang  
       11 小时 15 分钟前   ❤️ 1
    「实在抱歉」
    给楼主点赞,楼主讲究人儿,知错能道歉。
    royzxq
        58
    royzxq  
       10 小时 52 分钟前
    小米要是真套壳你猜第二天千亿营销费用是不是已经上了
    JYii
        59
    JYii  
       10 小时 47 分钟前   ❤️ 2
    你对这个问题认知不足,这是小问题。你能道歉,这根本不是问题了。
    tinydancer
        60
    tinydancer  
       10 小时 47 分钟前   ❤️ 1
    @shine1996 这种问题属于大模型入门级问题,并不需要大模型专家才能理解和回答,能问出这种问题说明连大模型的门都没有摸到
    furch
        61
    furch  
       10 小时 32 分钟前
    只能说小米活做的糙,套壳是不可能的,不过符合小米一贯风格
    gpt5
        62
    gpt5  
       10 小时 27 分钟前   ❤️ 1
    不死犟到底的 v 友,不多了。
    duanxianze
        63
    duanxianze  
       10 小时 5 分钟前
    既然你会用 AI 了,还特意用了小米的 AI ,消息不该这么闭塞的,很奇怪
    back0893
        64
    back0893  
       9 小时 52 分钟前
    又来?
    虽然我不喜欢小米 但是你可以换个方向黑
    lance07
        65
    lance07  
       9 小时 34 分钟前
    新时代没有载你的船了
    aduangduang
        66
    aduangduang  
       8 小时 53 分钟前
    很好奇,黑小米真的能得到快乐吗?还是这种行为能让你有优越感?(当然如果有人真的给钱,那请务必带上我一起!)
    如果是华为的模型,我猜你又要赢 800 次了
    xzl
        67
    xzl  
       7 小时 59 分钟前   ❤️ 1
    这个建议还是自己删帖或者版主删帖吧,没必要为了黑而黑。
    Rickkkkkkk
        68
    Rickkkkkkk  
       7 小时 30 分钟前
    不如说小米套壳安卓,更合理点。
    MidCoder
        69
    MidCoder  
       7 小时 26 分钟前
    貌似还套壳了 Kimi ,应该是蒸馏了 Kimi 的数据
    might1
        70
    might1  
       7 小时 12 分钟前 via Android   ❤️ 1
    非常感谢 OP 提出问题,然后看回复,发现自己的问题,又总结了一下。我觉得挺好的。我不觉得这种问题没什么意义,反倒是挺有意义的。像我就不知道其中的原理。
    coconutwater
        71
    coconutwater  
    OP
       7 小时 2 分钟前
    @xzl #67 看了删帖规则,题主自身是删不了的
    zzlove
        72
    zzlove  
       6 小时 58 分钟前
    和这个帖子有什么区别?都在一个群领的任务?
    https://v2ex.com/t/1178410
    WuSiYu
        73
    WuSiYu  
       5 小时 0 分钟前
    现在所有 LLM 基本都是赛博人体蜈蚣
    Grefer
        74
    Grefer  
       4 小时 48 分钟前
    我还以为能上 V 站的人至少稍微懂点技术,没想到依旧能看到这种博眼球倒垃圾的贴子
    Linon
        75
    Linon  
       4 小时 47 分钟前 via Android
    你的帖子问题已经被 claude 解决了!https://f.pz.al/pzal/2025/12/25/498ddd4a80229.jpg
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1428 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 16:42 · PVG 00:42 · LAX 08:42 · JFK 11:42
    ♥ Do have faith in what you're doing.