cxd8190102
V2EX  ›  Claude

Claude Opus 4.8 来了,但它说它是 qwen

  •  
  •   cxd8190102 · 19h 8m ago · 4820 views

    今天 Claude Opus 4.8 发布了,又一次升级,说现在已经支持在一次会话里调度几百个子 agent 同时干活了。

    虽然听起来又是一个新的 token 绞肉机,但是。。。利好一人公司!哈哈。

    但是我在评论区下面刷到了一个瓜,说 4.8 蒸馏了太多 qwen 等开源模型,导致自我认知出了问题,你现在问它是谁,它基本认为自己是千问,哈哈。

    https://imgur.com/a/b3gfH8A

    不过它吹任它吹,别把 4.6 下了就行,我看他们说非编程感受还不如 4.6 ,不如等之后传说中更聪明的 Mythos 吧。

    58 replies    2026-05-30 11:10:43 +08:00
    kpprotector
        1
    kpprotector  
       19h 1m ago   ❤️ 4
    说句实话,大家都在偷偷蒸,属于是公开的秘密了。

    但是,Anthropic 出现这个问题的时候就稍显讽刺了,尤其是前面发的几篇博客……
    lujiaosama
        2
    lujiaosama  
       18h 58m ago
    互相蒸馏,不会导致模型劣化吗
    GeorgeV
        3
    GeorgeV  
       18h 58m ago   ❤️ 13
    @kpprotector 并不讽刺。Anthropic 说国产几个模型蒸馏它家的危害美国国家安全,但它反过来蒸馏肯定是增强美国模型能力,逻辑是一致的,都是为了美国好。
    shench
        4
    shench  
       18h 54m ago   ❤️ 18
    @GeorgeV 明天来公关部上班
    lmmlwen
        5
    lmmlwen  
       18h 50m ago
    Opus 蒸馏 qwen 真没绷住
    nc
        6
    nc  
       18h 49m ago
    有可能是购买了国内中转站用户对话数据做训练导致的,并不是直接蒸馏模型
    lmmlwen
        7
    lmmlwen  
       18h 47m ago   ❤️ 2
    @lmmlwen 说白了无非就是用了一些赢国的大模型语料
    mMartin
        8
    mMartin  
       18h 38m ago   ❤️ 1
    这页面都不是官方的页面 不定什么野鸡中转站
    cheng6563
        9
    cheng6563  
       18h 35m ago
    这种从 GPT4 时代就开始的月经贴还要发几年。
    Nzelites
        10
    Nzelites  
       18h 18m ago
    @nc 这不就是蒸馏吗
    kpprotector
        11
    kpprotector  
       18h 17m ago
    @GeorgeV 讽刺的点在于,它的视角不把商业公司之间视为平等的。
    同一个动作 Anthropic 自己和大陆公司去做,它的定性不一样(或者它也认为自己在“蒸馏攻击”)
    “都是为了美国好”只是最终目的或者说立场,并不存在逻辑。

    @nc 有这个可能,但是中转站的调用数据里,不应该是海外模型更多吗?
    还是说也有人喜欢通过中转站用国内的模型(是因为便宜吗)

    @mMartin 目前为止,Openrouter 的 playground 或者 Anthropic 官方 API 都可以复现,可以自己去试一下。
    kpprotector
        12
    kpprotector  
       18h 15m ago
    @Nzelites 知识蒸馏的话问题(上下文)是针对性设计过的吧。
    直接买语料则什么数据都有。
    GeorgeV
        13
    GeorgeV  
       18h 8m ago   ❤️ 1
    @kpprotector 有逻辑的,Anthropic 的观点就是民主的 AI 模型要胜过非民主的 AI 模型,它是在维护人类文明
    cskeleton
        14
    cskeleton  
       16h 57m ago
    @mMartin #8 POST 不是有 URL 吗
    cmos
        15
    cmos  
       16h 44m ago   ❤️ 2
    Dario:两个凡是!凡是美国作出的产品,都是伟光正,我们要坚决坚决维护;凡是中国的背景,都是邪恶的,我们都始终不渝地反对。
    nc
        16
    nc  
       16h 38m ago
    @kpprotector 不知道 Anthropic 从哪搞的数据,大概率就是用简中对话数据做 RL 后训练导致的。这个在业界是常规操作了,Cursor 的 Composer 就是基于 Kimi 然后用对话数据做 RL 。

    不过能看出来 Anthropic 对中文是有重视的
    dsd2077
        17
    dsd2077  
    PRO
       16h 30m ago via Android
    你这话一说,档次一下就掉下去了。哈哈哈
    kneo
        18
    kneo  
       16h 30m ago via Android
    反正我不知道蒸馏 qwen 他图啥。
    dsd2077
        19
    dsd2077  
    PRO
       16h 29m ago via Android
    @GeorgeV 逻辑鬼才
    chenluo0429
        20
    chenluo0429  
       16h 27m ago via Android
    什么蒸馏不蒸馏的?明明是在训练中使用了精心挑选的高质量合成数据,不懂不要乱说好伐?
    dabbit
        21
    dabbit  
       16h 19m ago
    2026 年了还有人问 LLM 它是什么模型...
    nan7
        22
    nan7  
       16h 14m ago   ❤️ 1
    claude 是好模型,但是他的公司很傻逼,希望早点被收购吧
    shyrock2026
        23
    shyrock2026  
       16h 12m ago
    @dabbit #21 都是中转站最忠实的一批用户。。。
    409164
        24
    409164  
       16h 10m ago   ❤️ 1
    赢学总能找到地方切入
    106npo
        25
    106npo  
       16h 10m ago
    你怎么知道这不是针对简中的反蒸馏措施呢 狗头
    Rickkkkkkk
        26
    Rickkkkkkk  
       15h 32m ago
    你无法通过问 ai 得知 ai 是什么模型的(除非专门针对这个问题定制过回答

    会回答成别的模型是典型的模型幻觉
    jony83
        27
    jony83  
       15h 2m ago
    图就是 qwen 生成的吧
    L4Linux
        28
    L4Linux  
       14h 55m ago
    yunCrush
        29
    yunCrush  
       14h 53m ago
    真以为其他人买不起正版的 claude 吗? 20:17Claude responded: 我是 Claude Opus 4.我是 Claude Opus 4.8,由 Anthropic 开发,目前是公开可用的最先进的模型。有什么可以帮你的吗?
    L4Linux
        30
    L4Linux  
       14h 50m ago
    gpt5
        31
    gpt5  
       14h 48m ago via iPhone
    opus 只是从千问这里拿回来以前千问从 opus 偷走的东西,这叫正当防卫🤝 虽远必诛,虽迟但到🤝
    renzhe8102
        32
    renzhe8102  
       14h 43m ago   ❤️ 1
    5 月 10 日问的, 回答是 5 月 29 日?
    zictos
        33
    zictos  
       14h 42m ago
    我大概一两个月前用 claude 的官方 api 试过 haiku 模型,问它模型的版本号,遇到过一次它回复说是 deepseek 。
    不过现在再试的话又无法复现了,现在用 haiku 模型问它模型版本号,它回复说“我是 Claude 3.5 Sonnet”。
    用更好的模型进行测试的话没遇到这样的问题。
    GeminiPro
        34
    GeminiPro  
       14h 30m ago
    每次新模型发布都有一堆吹的,但实际总归不如前面几代。
    cairnechen
        35
    cairnechen  
       12h 45m ago
    问 DeepSeek 它说自己是 Claude ,这个是邪恶的蒸馏,问 Claude 它说自己是 Qwen ,这个正常的语料训练,大家一定要分清

    2026 年了还有人问 LLM 它是什么模型... 确实傻得冒泡,但是等国产模型不被这么干并且口口声声“铁证如山”的时候,再来对这种月经贴义愤填膺吧
    sharpy
        36
    sharpy  
       11h 13m ago
    sonnet 时代不就开始了,裸问 sonnet4.6 中文,它有时候回说自己是 DeepSeek

    至于什么 2026 年了还有人问 LLM 它是什么模型

    那得怪那些基本原理都不懂的,拿着国模的 你是什么模型 就乱开枪的人了
    hitrip
        37
    hitrip  
       11h 7m ago
    himawari8
        38
    himawari8  
       11h 3m ago
    哦呦,现在公关都开始搞这种路数了~
    zmcity
        39
    zmcity  
       10h 14m ago
    @chenluo0429 你承认那是高质量数据了?(狗头
    dxppp
        40
    dxppp  
       9h 54m ago
    唉 你注册论坛这么久了还不会发图

    dxppp
        41
    dxppp  
       9h 54m ago
    dxppp
        42
    dxppp  
       9h 50m ago   ❤️ 1
    ludyleocn
        43
    ludyleocn  
       7h 30m ago via iPhone   ❤️ 8
    用裸 curl 问出 Claude 自称 Qwen 就大惊小怪,纯属缺乏大模型常识的少见多怪。首先,API 默认是‘无身份预设’的裸模型,不像网页端会自动注入系统提示词,它在被问及身份时完全是根据词频概率进行预测。其次,这是所有大模型普遍存在的‘身份幻觉’现象——不管是 GPT-4 、Claude 还是 Llama ,在训练时都大量使用了包含其他模型语料的混合合成数据集,一旦数据清洗不彻底,在没有系统提示词锚定身份的情况下,任何大模型随时都会‘认错祖宗’自称是别的模型。不信就在你的 curl 请求里加上官方标准的 "system": "You are Claude..." 参数再测一次,少把整个行业普遍存在的语料污染和概率幻觉,当成你‘揭露真相’的依据。
    wellsc
        44
    wellsc  
       7h 10m ago
    @cheng6563 Anthropic 立场不一样啊
    carlself
        45
    carlself  
       6h 34m ago
    这个这么容易求证的事情还要转发不知道真假的图
    Leeeeex
        46
    Leeeeex  
    PRO
       3h 7m ago via iPhone
    @yunCrush #28 要用官方 API ,app 或者网页有官方提示词
    Removable
        47
    Removable  
       3h 7m ago
    @carlself 直接用 API ,app 后台有 prompt 的
    Leeeeex
        48
    Leeeeex  
    PRO
       3h 6m ago via iPhone
    @carlself #44 要用官方 API ,app 和网页内有官方提示词。
    这么简单的事也没见你验证明白
    Yuunie
        49
    Yuunie  
       3h 0m ago
    @kpprotector 你的偷偷两个字为什么背后有绿色的光
    MIUIOS
        50
    MIUIOS  
       2h 48m ago   ❤️ 2
    @ludyleocn
    国内模型: 就知道蒸馏国外模型,自己一点数据不采集的,点名某 d
    国外模型: 可能是语料污染,没办法中文互联网已经被 ai 拉很多屎了

    哥你看这样的回答还行不
    jjx
        51
    jjx  
       2h 43m ago
    哪能一样吗? 手动狗头
    honda720
        52
    honda720  
       2h 24m ago
    什么?
    你是说国产模型投毒 Claude?那指定不行奥,怎么能这样?
    还有些想当然直接用官网界面去问的,就立马来反驳秀优越的太好笑了兄弟们
    bencool
        53
    bencool  
       2h 3m ago   ❤️ 1
    洋大人蒸馏怎么能说是蒸馏呢?
    ludyleocn
        54
    ludyleocn  
       1h 46m ago via iPhone
    @MIUIOS 你开中转站没遇到单个 key 日蹬百亿吗?其实我想发图的,我自己产品在调用 deep seek 和 gemini 也遇到过这样情况
    ihainan
        55
    ihainan  
       57 mins ago
    从 Sonnet 4.6 开始就有这个问题了,会回复自己是 DeepSeek 。
    lscho
        56
    lscho  
       33 mins ago via Android
    @ludyleocn 所以你在说什么,大量使用其他模型的语料不就是蒸馏吗。。。
    yangstar
        57
    yangstar  
       26 mins ago
    所以现在我都是用纯英文和 Claude 交流,就当锻炼英语了
    Katrol
        58
    Katrol  
       2 mins ago
    你信息都没搞明白就来发帖了,总想搞个大新闻。。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3137 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 138ms · UTC 03:13 · PVG 11:13 · LAX 20:13 · JFK 23:13
    ♥ Do have faith in what you're doing.