V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
14c0r3y
V2EX  ›  分享发现

继 3.11🆚3.9 之后,出现了新的 gpt 难题: strawberry 里有几个 r

  •  
  •   14c0r3y · 127 天前 · 3688 次点击
    这是一个创建于 127 天前的主题,其中的信息可能已经有所发展或是发生改变。

    说得我都以为是真的了 img

    34 条回复    2024-08-14 13:32:14 +08:00
    whileFalse
        1
    whileFalse  
       127 天前 via Android   ❤️ 2
    哥人家用 token 的....
    sugarsalt
        2
    sugarsalt  
       127 天前
    噗,确实有问题
    zhucelws
        3
    zhucelws  
       127 天前
    试了一下,类似的问题都会错,比如 reference 有几个 e ,他会说 3 个
    zhucelws
        4
    zhucelws  
       127 天前
    claude 3 opus 说有 3 个 r ,3.5 sonnet 说只有两个
    BeijingBaby
        5
    BeijingBaby  
       127 天前 via iPhone
    类似的,ai 不会做小学数学题
    lovestudykid
        6
    lovestudykid  
       127 天前
    人有时候可以把整个单词作为一个整体辨认,有需要的时候又可以分析每个字母,相当于 tokenization 是可以变化的。
    Kinnice
        7
    Kinnice  
       127 天前 via Android   ❤️ 1
    因为他是个大语言模型,不是真正的 ai
    iyiluo
        8
    iyiluo  
       127 天前
    现在的 ai 是大力出奇迹,缺少原理性的理论支持,需要一位牛顿、爱因斯坦之类的理论开创者
    superrichman
        9
    superrichman  
       127 天前
    现在的大语言模型就是只鹦鹉,会说你想听的给你听。
    Meteora626
        10
    Meteora626  
       127 天前
    bpe 切分以后 模型根本不知道输入是啥
    paopjian
        11
    paopjian  
       127 天前
    这都快一个月了还没热更新吗? 据说这种问题可以让 LLM 走编程方法,另执行代码就没问题
    Tumblr
        12
    Tumblr  
       127 天前   ❤️ 1
    hmm... interesting!
    volvo007
        13
    volvo007  
       127 天前 via iPhone
    “拼写规则”,英语的拼写谁看了不迷糊啊😂
    csys
        14
    csys  
       127 天前   ❤️ 1
    虽然它在胡说八道 但是它好自信
    Ethanccc
        15
    Ethanccc  
       127 天前 via iPhone
    所有这些都可以叫他用 python 计算,结果就是对的了
    vvhy
        16
    vvhy  
       127 天前
    我觉得语句通顺就算成功
    xuwanglin
        17
    xuwanglin  
       127 天前
    回答是三个啊
    xuwanglin
        18
    xuwanglin  
       127 天前
    strawberry 这个单词里面有几个字母 r
    ChatGPT said:
    ChatGPT
    "Strawberry" 这个单词里有 3 个字母 "r"。

    You said:
    strawberry 这个单词里面有几个 r
    ChatGPT said:
    ChatGPT
    "Strawberry" 这个单词里有 2 个 "r"。
    msn1983aa
        19
    msn1983aa  
       127 天前
    strawberry 里有几个 r

    word count: 6, token count: 17, time: 13:56

    "Strawberry" 中确实有三个 "R"。

    word count: 8, token count: 22, tokens used: 1608, model: Ollama (llama3.1:8b), time: 13:57

    llama3.1:8b 已经可以正确回答了
    msn1983aa
        20
    msn1983aa  
       127 天前
    strawberry 里有几个 r

    word count: 6, token count: 17, time: 14:02

    答案是 2 个! (Just kidding, it's actually 3!) S-T-R-A-W-B-E-R-R-Y

    word count: 21, token count: 36, tokens used: 227, model: Ollama (llama3.1:8b), time: 14:03

    还挺幽默,还会 kidding 了
    Donaldo
        21
    Donaldo  
       127 天前
    @Tumblr #12 我这好像挺正常的
    redr41n
        22
    redr41n  
       127 天前
    单词“strawberry”中共包含三个字母“r”。具体来说,这三个“r”分别位于单词的第二个、第四个和第八个位置。这个单词是草莓的英文表述,而草莓(学名:Fragaria ananassa Duch.)是蔷薇科草莓属多年生草本植物,被誉为“水果皇后”,在全球广泛栽培和食用。

    关于这个问题,需要注意的是,对于人工智能大模型(如 GPT 、Llama 、Claude 等)来说,它们在处理类似任务时可能会遇到挑战,因为它们需要正确地理解和解析输入文本,并将其分解为基本的组成单元(如字母或 tokens )。然而,随着技术的不断进步和模型的持续更新,这些大模型在处理这类任务时的表现也在不断提高。

    在实际应用中,如果需要确定某个单词中特定字母的数量,可以使用编程语言的字符串处理功能来实现,例如 Python 中的 count()函数。这种方法对于编程人员来说是一种简单且有效的方式。同时,也可以考虑使用自然语言处理( NLP )技术来分析和处理文本数据,但这通常需要更复杂的算法和模型来实现。

    from 文心一言 3.5
    MrYELiex
        23
    MrYELiex  
       127 天前
    原理上决定了大模型不适合精确计算 但是也很好解决 中间加一个召回 tool_call 就行了 逻辑性的东西交给逻辑性的解决方案
    catalysia
        24
    catalysia  
       127 天前
    @zhucelws

    还是和提示词有关系

    在单词 "reference" 中,字母 "e" 的位置如下:

    r
    e (第 2 个)
    f
    e (第 4 个)
    r
    e (第 6 个)
    n
    c
    e (第 9 个)
    所以,"reference" 中的 "e" 分别在第 2 、4 、6 和 9 个位置。实际上,只有 4 个 "e",我之前的回答有误。感谢你的指正!
    masterclock
        25
    masterclock  
       127 天前
    bing:
    masterclock
        26
    masterclock  
       127 天前
    误发

    bing:
    strawberry 这个单词包含几个字母 R
    “Strawberry” 这个单词中包含 0 个字母 “R”。如果你还有其他问题,欢迎继续提问!🍓🤗
    yangzzzzzz
        27
    yangzzzzzz  
       127 天前
    看看百度的
    yangzzzzzz
        28
    yangzzzzzz  
       127 天前
    单词"strawberry"中有一个字母"r"。‌这个单词的拼写是固定的,‌不会因为语境或用法而改变。‌在记忆这个单词时,‌可以采用一些有趣的记忆方法,‌比如将"strawberry"拆分为"str-aw-ber-ry",‌并联想为“石头人(‌str )‌说爱我不(‌awb )‌,‌儿子(‌er )‌听了受不了把草莓给人妖(‌ry )‌吃”。‌这样的记忆方法既有趣又有效,‌可以帮助记忆单词的拼写和发音‌12 。‌

    近期,‌多家大模型在回答“strawberry 这个单词有几个 r”这一问题时出现了错误,‌这再次提醒我们,‌尽管大模型在很多方面表现出色,‌但它们的能力边界仍在探索中,‌我们还需要不断增强底层基础模型的智能水平‌34 。‌
    EricSTG
        29
    EricSTG  
       127 天前


    确实有问题 233
    Xi
        30
    Xi  
       127 天前
    国内的大模型几乎都试了一遍,用网页版没有任何提示词,智谱清言、kimi 、通义千问、讯飞星火都是回答 2 个,只有文心一言 3.5 和字节的豆包回答是 3 个
    zjl03505
        31
    zjl03505  
       127 天前
    I see where you're coming from, but the total number of "r"s in the word "strawberry" is not the sum of the "r"s in "straw" and "berry" individually. When you combine the words "straw" and "berry" into "strawberry," you count the "r"s in the entire word as it is spelled.

    In "straw," there is one "r."
    In "berry," there are two "r"s.

    However, when combined into "strawberry," the total number of "r"s is still two because "berry" contributes both of its "r"s, but "straw" does not add any additional "r"s beyond what is already counted.

    So the total remains two, not three.

    它自恰了
    CivAx
        32
    CivAx  
       126 天前
    更有意思的是,我故意打错了 Strawberry 想看 OpenAI 的纠错功能有没有令我失望,结果他只识别出来一个 R 字母😅

    CivAx
        33
    CivAx  
       126 天前
    @CivAx #32 不仅认不清有几个 r ,甚至连位置也没法正确列出来:
    wangyaominde
        34
    wangyaominde  
       126 天前

    提示词真的有用,毕竟 GPT 认识字的编码器是一个高维空间的向量,就是“strawberry”这个词已经被高维度的“意义”替代了,就跟给人一个实物草莓的意义差不多,不管是什么语言,都被抽象到了“意义”这个概念
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4746 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 09:59 · PVG 17:59 · LAX 01:59 · JFK 04:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.