V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
chenzhe
V2EX  ›  随想

出了个乌龙,被各个 AI 搞的恍惚了。

  •  5
     
  •   chenzhe · 36 天前 · 4633 次点击
    这是一个创建于 36 天前的主题,其中的信息可能已经有所发展或是发生改变。

    乌龙

    起因

    今天早上,我在浏览论坛时看到了一篇帖子 链接。因为刚醒,头脑昏沉,并没有仔细阅读,只是随意扫了一眼。帖子里提到了 uv 这个包管理器工具,我没留意它其实是 Python 相关的包管理器。由于名字短小简洁,我就把它记在了脑袋里。

    晚上的尝试

    晚上闲下来,我突然想起了这个 uv 工具,于是决定向 AI 提问,看看它能给我什么答案。

    提问

    “帮我对比一下 uv, yarn, npm, pnpm 之间的区别。”

    AI 给出的回复如下:

    Google Gemini 2.0 Pro

    看完 Google Gemini 的介绍,我觉得这款工具很不错,于是按照它给的网址直接打开文档并开始安装。

    安装尝试

    我满怀兴奋地删除了原有的 Node.js 项目的 node_modules,想要试试 uv 的速度。根据惯性思维,我输入了几个安装命令,但是都没有成功。于是,我去查看官网。

    发现问题

    官网的内容几乎都是 Python 相关的,完全没有涉及 Node.js 或 JavaScript 。这时我感到一丝疑惑,脑袋里仍然清晰记得我是在一个 Node.js 相关的帖子里看到过 uv 这个包管理器的名字。更奇怪的是,Gemini 的回答也提到它是 Node.js 的包管理器。

    这时候我去找别的 AI 问了第一个问题

    1. Github Copilot (Claude 3.7 Sonnet)

    Github Copilot Claude 3.7 Sonnet

    2. Github Copilot (GPT-4o)

    Github Copilot GPT-4o

    3. Grok

    Grok-3

    4. Deepseek R1

    Deepseek R1

    质问 AI

    “我看到 uv 文档 上完全没有提到 Node.js 的操作,都是 Python 相关的内容,怎么回事?”

    此时大部分 AI 都告诉我他们搞错了,只有 Grok 并没有表示它搞错了,只是又开始自顾自的表述 nv 跟 Python 之间的关系。

    虽然 AI 在某些领域能提供帮助,但最终我们仍然需要依赖自己的判断力,确保能够在面对技术问题时做出明智的决策。

    44 条回复    2025-03-26 16:10:19 +08:00
    ddmasato
        1
    ddmasato  
       36 天前
    ai 在一本正经的胡说八道(ಡωಡ)
    ltaoo1o
        2
    ltaoo1o  
       36 天前
    不止胡说八道,有时候智障,真是把我气笑了。之前发现,一个简单的问题

    > js 代码 "Tom told John he failed the exam.".slice(10,12) 的结果是什么,算不出来

    https://static.funzm.com/assets/images/d0e6893d061c038a.png
    learnshare
        3
    learnshare  
       36 天前   ❤️ 2
    一般内容,仍需要人类判定真假;
    代码内容,仍需要人类搭建环境、运行和调试;
    自动驾驶,仍需要人类双手握住方向盘,随时接管。
    NoOneNoBody
        4
    NoOneNoBody  
       36 天前   ❤️ 2
    AI 在“顺着受害人的话继续展开”这方面的能力,远超过诈骗犯
    Remember
        5
    Remember  
       36 天前
    现在的所有 AI 都会这样,一个不存在的东西都能给你编的栩栩如生。
    foolishcrab
        6
    foolishcrab  
       36 天前 via iPhone
    这就是为什么 ai 在解决业务属性强的代码 bug 的时候非常危险
    linghan
        7
    linghan  
       36 天前 via iPhone
    Ai 是真的一本正经的胡说八道,有个值是数值类型,但是 es 字段类型也定义错了,我应该定义成 int 类型的,但是定义成了 keyword ,使用 range 查询就有问题,然后我问 ai 有没有办法不新增字段的情况对这个字段进行 range 查询,他一本正经的说如果是这个值是数值的话是可以进行 range 查询的,可以个锤子哦
    icyalala
        8
    icyalala  
       36 天前
    现有的 LLM 很不擅长处理这类 “我不知道,或者我不太确定” 的问题。
    当你问题涉及这类情况,AI 就只能顺着你的说法去生成新内容。

    其实人也有类似表现。
    AndrewHenry
        9
    AndrewHenry  
       36 天前
    ai 不能放在一起问(放在一起他会认为这些是一个东西给你胡编),只能单个单个的问
    msg7086
        10
    msg7086  
       36 天前
    我问了一圈以后怀疑是因为这个原因:
    「我之前的回答将它与一个类似的但不太相关的 JavaScript 包管理器混淆了。」
    问他 uv 的官方链接结果他给的是 pixi ,应该是把原材料搞混淆了。

    另外在打开 Gemini 的接地功能以后,可以返回正确结果,也有正确的来源标注:
    「[1]历史: uv 是由 Astral 开发的,使用 Rust 编写的 Python 包和[9][11]项目管理器。」
    应该是去搜了关键字以后更新了知识。
    shiny
        11
    shiny  
       36 天前   ❤️ 1
    题外话,你应该试试 bun
    wwhc
        12
    wwhc  
       36 天前
    本地部署的 Qwen_QwQ-32B 很老实,明确表示不知道 UV ,要用户提供该工具的详细信息:

    关于“UV”

    如果“UV”指的是某个特定工具,请提供更多上下文。以下是一些可能的解释:

    可能的拼写错误:
    v 或 npx:v 是一个包版本管理工具,而 npx 是 npm 的执行工具。
    unpkg:一个 CDN 服务,用于快速访问包,但非包管理器。
    Unity Package Manager:Unity 的包管理工具,与 Node.js 无关。
    其他可能性:
    如果是某种自定义工具,请具体说明。
    ......
    如果需要进一步探讨其他工具(如 UV 的具体含义),请补充信息!
    DOLLOR
        13
    DOLLOR  
       36 天前
    典型的 AI 幻觉,问它 A ,它会把 B 的东西移花接木说给你听
    ZE3kr
        14
    ZE3kr  
       35 天前 via iPhone
    你就说正确率是不是 75% 吧
    samli12
        15
    samli12  
       35 天前   ❤️ 2
    AI 本质只是计算下一个字符最有可能是什么
    wnpllrzodiac
        16
    wnpllrzodiac  
       35 天前 via Android
    @icyalala 完全人的思路。顺着来回来不会错。
    kevinbeta
        17
    kevinbeta  
       35 天前 via Android
    现有大模型关于 uv 的资料确实少 一般说 uv 他们会联想到紫外线或者其他项目上去
    4UyQY0ETgHMs77X8
        18
    4UyQY0ETgHMs77X8  
       35 天前
    现在的 ai 需要你搞清本质再去问问题或者先让他讲述某一个,然后再弄
    yb2313
        19
    yb2313  
       35 天前   ❤️ 5
    你把 r1 关了干什么
    dwu8555
        20
    dwu8555  
       35 天前
    @wwhc #12 Qwen 还是挺强的
    lynnharry
        21
    lynnharry  
       35 天前
    直接给我幻想出来一个新的工具包 UV ( Unjs Vector ),UV 的官方网站是 https://uv.unjs.io/ 这是由 Unjs 团队开发的 UV 包管理工具的官方网站。
    shylockhg
        22
    shylockhg  
       35 天前
    @lynnharry 又幻想了:)
    MoneyWasUseless
        23
    MoneyWasUseless  
       35 天前
    mac os 颜值确实是高,这个 UI 看的是真舒服。。
    woodfizky
        24
    woodfizky  
       35 天前
    LLM 本质就是预测下一个词,只不过现在训练的很多场景预测的都不错而已。
    本质上,跟赛博算命没什么区别,算对了你觉得很厉害,偶尔算错了就祛魅了。

    如果你区分不了"AI"提供的内容正确性,还要依赖"AI"的话,你大概率会被它们时不时的幻觉和错误计算狠狠阴一把。


    换个角度想,跟人也类似的,你作为领导/上司 提出一个诱导性强,容易回答错的问题给真人员工,真人一样容易搞错。
    MoneyWasUseless
        25
    MoneyWasUseless  
       35 天前   ❤️ 1
    @yb2313 开了 R1 以后就没有 OP 这个情况了,R1 确实牛逼,直接分析出了 uv 就是 py 那边的工具,然后思考用户这边可能是弄错了。


    mrcotter2013
        26
    mrcotter2013  
       35 天前 via iPhone
    现阶段使用 AI 需要自己有一定的判断力和基础知识。用它来写代码也是,如果读不懂,AI 经常会乱来,甚至改掉你原本的需求……
    coolfan
        27
    coolfan  
       35 天前
    哈哈哈 好问题,全军覆没啊
    davidyin
        28
    davidyin  
       35 天前 via Android
    人工智障還是要小心使用。
    dkrao
        29
    dkrao  
       35 天前
    所以 ai 从来不会说它不知道,不知道的它就自己瞎编,被你发现了它就找借口说搞错了,抱歉!
    charles0
        30
    charles0  
       35 天前
    gpt-4.5 指出:uv 不是一个包管理工具,更多是指与 Deno 相关的底层库(如果你是指这个)。
    https://chat01.ai/zh/chat/01JQ84ZZVPWVW58EEX8C5QSZXT
    charles0
        31
    charles0  
       35 天前
    但是它的回答的第一行还是有一点迷惑性,虽然后面具体解释 uv 的时候它说 uv 可能是指 Deno 的 uv 库:在某些文档中提到的 uv 可能指的是 Deno (一个新的 JavaScript/TypeScript 运行时)所用的底层库 libuv ,这是一个提供事件驱动、异步 I/O 操作的库。它不是一个包管理工具,而是用于 Deno 环境中的底层 I/O 操作,类似于 Node.js 中的 libuv 库。
    charles0
        32
    charles0  
       35 天前
    连 GPT-4 都能回答正确,它第一句话就是:在讨论 uv, yarn, npm, 和 pnpm 之间的区别之前,我想先澄清一下可能存在的误解。uv 在这个上下文中可能是一个笔误,因为 uv 通常不与包管理工具相关联。假设你指的是 npm, yarn, 和 pnpm 这三种 JavaScript 包管理工具,我将基于这个假设来进行比较。
    vicalloy
        33
    vicalloy  
       35 天前
    uv 太新了,如果不联网各 AI 关于 uv 的资料太少。而且还有 libuv 、uvloop 之类的知名库让 AI 混淆。
    Perry
        34
    Perry  
       35 天前 via iPhone
    你的问法让 AI 默认了 uv 是和 yarn npm pnppm 相关的,导致了更容易得到幻觉的结果
    inhzus
        35
    inhzus  
       35 天前
    问 AI 的语句确实要尽量保证没有错误...
    Perry
        36
    Perry  
       35 天前 via iPhone
    你的问法并没有让 AI 知道你只想比较 JS 包管理器,因为完全
    Perry
        37
    Perry  
       35 天前 via iPhone
    因为完全有可能我只是想比较不同语言的包管理器
    wolfie
        38
    wolfie  
       35 天前
    这不是随便用几天就知道的吗?
    grok 确实强,降智的 gpt 没有任何主见,反驳就改变回答,再反驳就再次改变回答。
    Perry
        39
    Perry  
       35 天前
    这就是你在问 “帮我对比一下 ruby on rails, express.js, koa.js, hapi 之间的区别。”
    shyangs
        40
    shyangs  
       35 天前
    @Perry

    如果 AI 想應用到醫學、法律、自動駕駛領域,克服幻覺和錯誤誘導是必須的.

    病人的主訴完全有可能誤導醫師.

    主訴: Disk 故障,檢查後結果是主板/POWER 故障. 如果換到外科情景那不就是拔錯牙,或割錯器官了(左腎右腎割錯醫療事故)
    eroneko
        41
    eroneko  
       35 天前
    试了最新的 Gemini Pro 2.5 ,也是一本正经地胡说八道:
    uv 是一个新兴的工具,由开发了 Ruff (高速 Python Linter) 的 Astral 公司开发,它首先是一个 Python 包管理器和工具链 (旨在替代 pip, pip-tools, virtualenv 等),但也实验性地加入了对 Node.js/JavaScript 包管理的支持,目标是利用其 Rust 实现的超高性能。
    Fallenwood
        42
    Fallenwood  
       35 天前
    问了下 ms copilot, 不认识 uv, 没啥问题, 补充包管理器的信息之后说的也是对的

    Vegetable
        43
    Vegetable  
       35 天前
    uv 太新太小了,你如果问的是 rye ,就不会这么难看
    Abbeyok
        44
    Abbeyok  
       35 天前   ❤️ 1
    ai 很擅长一本正经的胡说八道,所以自己不了解的东西一定要先去了解了解再去针对性问
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   828 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 21:17 · PVG 05:17 · LAX 14:17 · JFK 17:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.