V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
maymay5
V2EX  ›  Apple

提问:关于 IOS 18 的 AI 更新,为什么会有人觉得不厉害?

  •  
  •   maymay5 · 10 天前 · 3241 次点击

    我先阐述我的观点

    • 有很多人说苹果的 AI 参数很少,好像是 3B

    可问题是,苹果自始至终都不是一家人工智能公司,为啥要比参数?

    • 应用方面:我觉得 siri 就做得挺好的,充分把 AI 的能力融入了系统,比如识别 i 马杀鸡的聊天内容,自动响应用户说的话,存入通讯录,提取地址什么的,而这一整个融合用户界面交互的 AI 操作,我只需要长按唤醒 siri

    • 对比:我对比了一下 vivo 的小 v 助手,我说这是一个 ChatGPT APP 的复制版+function calling 的系统 API 调用,应该挺准确了,我一个破手机,我为啥需要没事打开一个对话框和一个 AI 助手聊天?或者让他绘画?典型的延续了安卓的特点:啥都有,啥都不全面,实现了就上线,使用体验再慢慢更新

    我也没到结晶果粉的程度,苹果的信号问题,功耗问题,发热问题,我一直是先骂为敬。

    • 但是这次 ios18 的 AI 方面,确实很符合我对手机 AI 的期望,让 AI 融入各式的 APP ,达到各式联动,想象几年后的一个非常简单的场景:我只要打开京东的收货地址页,然后唤醒 siri:帮我把收货地址复制到淘宝,siri 如果能马上完成,我觉得就很酷了,至少现在,我还需要手动复制,还他妈格式不整齐,苹果 AI 很明显是准备往这个方向走,而不是注重于弹出一个破框,让 AI 做一些看上去有用,实际对大部分人毫无卵用的,文件总结,绘画,查资讯,因为这会有专门的 AI 公司去实现,肯定会比个卖手机的做得好
    61 条回复
    Fike
        1
    Fike  
       10 天前 via iPhone
    方向我认为走的挺对的,但是演示的很好,实际用起来存疑,如果这么少的参数就能实现从系统中的各个应用中抓取信息并且准确地进行回答,那苹果确实 nb
    Fike
        2
    Fike  
       10 天前 via iPhone
    另外,大部分人用手机还是习惯用手操作而不是用嘴说
    amon
        3
    amon  
       10 天前
    AI 最终还是要落地到实际的场景中,而不是写首诗画个图这样的伪场景。
    不用相信苹果的 AI 能力,相信苹果的资源整合和产品能力就行。
    kyor0
        4
    kyor0  
       10 天前   ❤️ 1
    这次的 ai 应用落地,苹果基本就是走在最前面的做了很多 ai 应用的融合。

    反而对 siri 的聊天不是很关心,现阶段能做好系统底层的融合,等将来 ai 和硬件的提升再来彻底打通 app ,不过那个时候应该也没有 app 了,或许连手机都没了。苹果的头显我觉得是和 ai 配合的最佳硬件。

    生成 ai 的话,我觉得和 openai 合作是个非常好的选择,以及之后肯定会有更多的大模型扩充就和现在搜索引擎一样
    234ygg
        5
    234ygg  
       10 天前
    有一说一,我对短期内国内这些 app 厂商会不会接入,或者说多大程度上接入 app intents api 不太乐观
    oIMOo
        6
    oIMOo  
       10 天前   ❤️ 1
    首先从我个人角度来说,各种功能将人工智能融入肯定是大趋势了,毕竟有些所谓基于规则的流程都敢说基于人工智能了。
    很多人觉得不好,是看结果。前几名的成绩在哪里摆着,不如他们被别人说很正常,不能用“你知道哥哥有多努力么”来当作不够好的理由和借口。
    要么做的好,要么别怕被说。
    hanqian
        7
    hanqian  
       10 天前
    融合应该是没啥问题,相信产品质量和使用体验也不错,但看起来并没有很高的护城河,其他厂商也能搞,所以感觉平平无奇
    gzhjj
        8
    gzhjj  
       10 天前
    个人认为还是要用上了一段时间之后才能说厉不厉害。哪次苹果出新不是一堆人吹?
    Stevenv
        9
    Stevenv  
       10 天前
    还没用上,现在讨论都是云
    Daitabashi
        10
    Daitabashi  
       10 天前
    WWDC 全是画饼 库克请了几百个媒体也不过是纯看 ppt 没人上手 这种饼微软画过 谷歌也画过 什么 AI 赋能根本就不靠谱 还是先等 9 月等落地吧 哦对了只限英文哦 大模型还能分语言 真的不是印度程序员手写的 if else 吗
    jiaslbang
        11
    jiaslbang  
       10 天前
    中文 AI 估计得明年中甚至下了,这饼有点久。
    还有就是配合度问题,各家数据资产圈地自萌的风气已经很久了,你要微信 OS 这种愿意接入 intents ,恐怕阻力不小(即使接入实际上只是本地开放给用户自己)
    Tufutogo
        12
    Tufutogo  
       10 天前 via Android
    参考 vision pro
    smartruid
        13
    smartruid  
       10 天前
    感觉用处不大,也就 siri 变聪明些了。
    苹果的本地化或者说中文环境适配,一直是一坨,不要抱太大期望。
    otakustay
        14
    otakustay  
       10 天前
    追回下信息,苹果的模型在 arxiv 上是公开的,benchmark 数据也是公开的,从数据看基本是符合发布会的表现的
    mxalbert1996
        15
    mxalbert1996  
       10 天前 via Android   ❤️ 2
    我发现很多人好像都不知道 Android 有个智能助手叫 Gemini ,更不知道有些功能甚至早在 Gemini 出世之前的 Google Assistant 就已经可以实现了。
    phub2020
        16
    phub2020  
       10 天前
    无法调用第三方 app 的 ai ,再有用估计也有限
    ShadowPower
        17
    ShadowPower  
       10 天前   ❤️ 1
    苹果的 3B 参数量模型就在这里:
    https://huggingface.co/apple/OpenELM-3B-Instruct

    微软的 3B 在这里:
    https://huggingface.co/microsoft/Phi-3-mini-4k-instruct

    阿里的 1.5B 模型:
    https://huggingface.co/Qwen/Qwen2-1.5B-Instruct

    跑这些模型所需的硬件要求都很低,我相信能看到这个贴子的人都能跑得起来。
    上面的微软 Phi 3 Mini 将来会作为 Windows 系统内置的模型,开放给 Windows 系统功能以及第三方应用调用。

    可以亲自试一试,这样就能亲自得出“苹果的模型不厉害”的结论了。

    有时候,对产品功能的设想可能很美好,但不是每一个能在手机上离线运行的模型,都能满足设想中的美好场景。
    maymay5
        18
    maymay5  
    OP
       10 天前
    @mxalbert1996 Gemini 跟 ChatGPT 就是同类竞品,当成一个工具 APP 还行,做不到云边协同就进入手机系统永远是个 beta ,比如三星就是赶鸭子上架的典型,海外用 Google ,大陆用百度
    maymay5
        19
    maymay5  
    OP
       10 天前
    @ShadowPower 部署完然后用麻省理工的题目给他们打个分是吗?我的帖子一些写得不能再透彻了,没有应用,就算是兆亿 B 的参数,他也是个玩具,苹果这做应用的探索已经表现得很明显了
    maymay5
        20
    maymay5  
    OP
       10 天前
    @234ygg 这些在软件工程方面应该是很容易实现的,只需要 IOS 开放函数调用 API ,第三方 APP 通过审核就可以植入,跟 openai 的 tools call 师出同门,虽然具体实现不可能这么简单,但是开放是完全可以做到的,至于第三方 APP 嘛,这属于时间问题了,就像灵动岛,应用也是慢慢去适配的,如果 Apple 的 AI 云服务放在云上贵州,我想第三方 APP 还是不会跟进太慢的
    maymay5
        21
    maymay5  
    OP
       10 天前
    @hanqian 这确实,只能说他是第一个敢这么做的,实现这样的场景确实很容易复制
    mxalbert1996
        22
    mxalbert1996  
       10 天前 via Android
    @maymay5 所以我才说你根本不了解 Gemini ,手机版 Gemini 集成了 Google Assistant 的功能。
    mxalbert1996
        23
    mxalbert1996  
       10 天前 via Android
    ZE3kr
        24
    ZE3kr  
       10 天前 via iPhone
    至少资本还是认可的,AAPL 的股价最诚实了
    newarea
        25
    newarea  
       10 天前 via iPhone
    只是大家觉得 apple 能告诉大家 ai 到底应该怎么盈利
    maymay5
        26
    maymay5  
    OP
       10 天前
    maymay5
        27
    maymay5  
    OP
       10 天前
    @mxalbert1996 #23
    * 在写作、头脑风暴、学习等方面获得帮助
    * 总结及快速查找 Gmail 或 Google 云端硬盘中的信息
    * 即时生成图片
    * 通过文字、语音、照片和相机获取帮助,探索全新互动方式
    * 在 Android 设备上,只需说“Hey Google”,即可唤出 Gemini ,就手机屏幕上的内容寻求帮助
    * 使用 Google 地图和 Google 机票规划行程
    请你说一下,这玩意和小 V 助手的区别
    mxalbert1996
        28
    mxalbert1996  
       10 天前 via Android
    @maymay5
    你就看了最顶上那几条也好意思来回复啊?
    Google Assistant features in your Gemini mobile app 看了么?
    maymay5
        29
    maymay5  
    OP
       10 天前
    @mxalbert1996 #23 而且重要的是,也要考虑国情啊,国内 APP 在可预见未来能接入 Gemini 协同吗
    mxalbert1996
        30
    mxalbert1996  
       10 天前 via Android
    @maymay5 别转移话题。你想喷国内厂商那就说清楚,别扯上整个安卓。
    maymay5
        31
    maymay5  
    OP
       10 天前
    @mxalbert1996 #30 扯上整个安卓?我的原话 “典型的延续了安卓的特点:啥都有,啥都不全面,实现了就上线,使用体验再慢慢更新” ,这个特点你也要反驳一二?我原本哪一出说过安卓 AI
    mxalbert1996
        32
    mxalbert1996  
       10 天前 via Android
    @maymay5
    我不知道你的逻辑在哪里,不过就算你说的对吧,但哪怕是在这样的安卓上,Gemini 也早已实现了苹果 AI 的功能。
    wonderfulcxm
        33
    wonderfulcxm  
       10 天前 via iPhone
    有钱就用 ai ,没钱就…
    maymay5
        34
    maymay5  
    OP
       10 天前
    @mxalbert1996 #32 那你觉得 Gemini 这些功能,强还是不强,好用还是不好用呢?

    如果强,好用:算是苹果照抄的,那请问,苹果 AI 抄过来就不强了,不好用了?

    如果不强,不好用:那你以 Gemini 作为论据的意义是什么呢?来反向证明苹果的这次更新是谷歌玩过的,要胎死腹中的产品?

    我觉得你只想反驳一点:谁第一个做的,安卓早就做了,凭什么 Apple 的会被人拿出来发帖吹,谷歌的躺在文档里,至于这个问题,我建议你开个专题贴,两个人没有讨论意义,应该是两群人
    HeraingBus
        35
    HeraingBus  
       10 天前 via iPhone
    @mxalbert1996 确实
    ShadowPower
        36
    ShadowPower  
       9 天前   ❤️ 3
    @maymay5 我的意思是,基础设施都没有做好,所谓的应用场景都只是空中楼阁。就像你指望用 GT610 显卡开最高画质畅玩 3A 大作一样。
    如果有一个好的模型,实现你说的那些东西,比开发一个普通 APP 的难度还低。

    你对其他厂商的了解不多,所以你会觉得苹果的想法非常独特,仿佛大家都想不到一样。楼上有个人提了 Google ,我就不重复了。

    你可能觉得所有国内厂商的语音助手就像 siri 那样大多数时候只会打开网页搜索,而没多少与系统集成的功能。但 4 年前发布的 MIUI 12 就可以做到:
    “帮我订张从 A 到 B 的机票”:会打开携程,然后跳转到查询机票的页面,自动填入你提到的出发点、目的地、日期;
    “我想知道去 XXX 的路怎么走”:会帮你打开百度地图或者高德地图,查询路线,从你的位置到你说的目的地
    还有其他场景,例如打车等。或者最经典的:“我想听雷军的歌”(这个实现得更早,太简单了,siri 都能做类似的事情)

    虽然这玩意诞生的时候并没有现在这么强的 LLM ,当时的手机内存容量和运算性能也不足以运行这样的东西。但是,语音助手与系统、第三方应用的对接,其实早就想到并实现了。

    在这种基础上,想利用 AI 来整合信息,调用第三方应用,其实只需要在现有的基础上,接着往前走一步就可以了。

    我所在的小公司里的产品经理,都设想过你想象的那些场景,难道这么多手机厂商的产品经理,就没有一个想到过吗?


    目前国内确实没有手机厂商把这玩意真正做出来,只是初步将 LLM 用在聊天和画图里。不过苹果目前只停留在 PPT 上的 AI 照片编辑,国内厂商倒是已经实现了手机上离线运行的。

    没做出来未必是没想到这种创意。用云端大模型应该可以实现,但是成本太高,商业上划不来。而过去能在手机上运行的模型,对于这样的应用场景效果都不好。

    实际上我在公司里做过类似的东西,虽然不是手机上用的。功能是用一串自然语言描述的复杂需求,转成对应的系统功能页面+数据+需要执行的操作。后来因效果不好,且效果好的方案成本极高,没有商业价值,老板放弃了。

    2024 年以前的 7B 及以下参数量的模型一个都做不到,起码得 70B ( PS:那会我都觉得 Yi-34B 是最好的基础模型,但 SFT 做得不好,导致直接用官方的模型感觉不是很好)。现在用 Qwen2 7B 的性能应该勉强可以做到,但我没有专门测试过,不保证。1.5B 的性能估计只能应付简单场景了。

    当时公司还打算去买智谱清言的 ChatGLM 模型来实现上面说的那种需求,那时候计划用 12B 参数量的,所以我和他们团队有过一次沟通。

    他们透露了小米也找过他们……


    今年确实有一些让人眼前一亮的小参数量模型,而且低成本长上下文的技术也有一些突破,很多 LLM API 价格暴跌。

    谷歌自己掌握优质数据,有 AI 领域的人才,自己训练模型而且目前还非常强,同时还做手机,能最早落地也不意外。微软的情况类似,所以从 Windows 11 24H2 开始就能在系统层面提供这方面的能力。

    前提都是有性能足够好的,能在手机(或者轻薄本)上跑的模型。自己做不出来也没关系,可以找其他公司合作,但确实今年(甚至就两三个月前)才有,能到用户手里的时间只能更晚了。

    只是 6 月正赶上 WWDC ,苹果提了一下这玩意,而且关注的人比关注谷歌、微软的多,所以会觉得似乎只有苹果才能想到这些。

    然而微软宣传 Windows Copilot (后面换了很多说法)那会都提出了类似的想法。从现在算起,一天半以后都有搭载相应功能的产品开始发货了(微软要求 40 TOPS NPU ,所以需要等骁龙 X Elite 产品上市,其他设备都不提供支持)。
    hiapk
        37
    hiapk  
       9 天前
    厉害? 用了能让我银行账户多加几个 0 吗
    crackidz
        38
    crackidz  
       9 天前
    这个东西大多是成熟的 AI 应用,在各个 AI 应用甚至部分安卓系统已经提供的功能。
    其实最大的问题还是门槛太低了,苹果能做别人自然也能做,甚至不会有什么太大差异。当然我不看好各家手机厂商自己做,需要系统层面 Google 统一一个标准就行了

    另外关于 Web 的,也有人做了一个 Web Intents 的东西 https://github.com/MegaPortal/web-intents-for-llms/
    Mandelo
        39
    Mandelo  
       9 天前
    厉害国行也用不上 gpt
    robo
        41
    robo  
       9 天前
    可惜 iPhone 15 Pro 以上机型才支持,多些机型支持就好了
    aogu555
        42
    aogu555  
       9 天前
    前面说了一大段,最后的结论居然是「想象几年后的一个非常简单的场景」.......
    Huelse
        43
    Huelse  
       9 天前
    拉倒吧,苹果现在的高管只会考虑利润,不会注重实际体验。当年他们居然要求 Siri 要始终能给出贴切的答案不要用户反馈,不然就不上,然后就起了个大早赶了个晚集,要死不活的样子。
    maymay5
        44
    maymay5  
    OP
       9 天前
    @aogu555 那你认为应该是什么结论,几年后苹果 AI 让人类机械飞升,长生不老?
    CY4suncheng
        45
    CY4suncheng  
       9 天前
    你也不要说什么「实际对大部分人毫无卵用」的结论,只代表你自己就行了,对我来说语音唤醒 Siri 就是一个很吧别扭的场景,除非在家里自己一个人,要不我才不会用语音。
    unco020511
        46
    unco020511  
       9 天前
    都是一些期货,并且还是一些没啥用的期货
    jevin
        47
    jevin  
       9 天前
    我觉得首先苹果说的这个嵌入到系统里面的思路,和其他家的思路基本一致,不是那种你用全键盘我用一整块屏幕的对行业有指引作用的革命性思路。
    然后,实际体验中,我们其实在国产安卓手机上也体验到了不同的 AI 应用,重点是目前已经体验到,并且各家厂商也明确说了会继续融合进系统,体验肯定是会一直进步的,而苹果只是给我说了要这么去做,我预计明年下半年可能可以见到,我预计苹果的产品设计能力比较强,会有更优雅的体验感受。
    所以,我觉得一个大家都在做的事儿,苹果目前只是画饼,并且一如既往的拿出一份体验优雅的产品实现,并没有什么特别厉害的感觉。也不明白为啥,它发布会一说了,我就应该觉得,这个好厉害~
    mxalbert1996
        48
    mxalbert1996  
       9 天前 via Android   ❤️ 1
    @maymay5
    你再读一遍你的主帖,看看是谁先用对比的方式来证明苹果 AI 很厉害?
    我想表达的很简单,你问为什么有人觉得不厉害,我说因为 Google 已经实现了所以有人觉得不厉害,你觉得这个理由还不够充分?必须要所有人都称赞才行?
    234ygg
        49
    234ygg  
       9 天前
    @maymay5 #20
    什么叫“第三方 APP 通过审核就可以植入”??? 开发者需要自己选择合适的功能主动一个一个功能的接入,哪有什么容易。那问题就来了,接入 app intents 能增加用户打开 app 的时间/频率吗,不打开 app 怎么曝光自己 app 里的赚钱项目?赚不到钱谁愿意接入?可预见这就是大多数国内厂商的想法
    234ygg
        50
    234ygg  
       9 天前
    大多数厂商即使接入,也不会做什么复杂的功能,没什么连续任务执行能力就意味着对大多数人来说,在有屏幕的设备上,还不如自己打开 app 点几下来得快。

    简直就像最近 zfb 搞得那个什么 nfc 付款一样,核心还是要用户打开 app ,尽量让用户看眼 app 里的推销
    maymay5
        51
    maymay5  
    OP
       9 天前 via iPhone
    @234ygg 你如果从技术方面来剖析,那倒确实还有难度,因为同类软件的同类 api 接入就很容易造成 AI 选择错误,你从产品角度来说,这基本没啥意义了,我只举一个例子:深色模式,可以回答你这个问题,苹果不是独家深色,各家手机厂商都有系统深色开关,你就说你做不做吧,同理,各家手机也都会开发 AI 的系统接入入口,你就说你接不接吧,不接入,同类竞品能被 AI 唤醒,你不行,这块用户的钱你就要被友商赚走,对于抢占手机资源的能力,我绝对信任国产软件商,连灵动岛这种花瓶都恨不得养个电子宠物进去,手机给一个能除了点击图标的另一个唤醒自家软件的入口,我认为他们不但会做,还会抢着做,所以才需要审核
    maymay5
        52
    maymay5  
    OP
       9 天前 via iPhone
    @234ygg 甚至如果想美好一点的话,这种接入权限会像通知权限一样下放给用户,让用户选择可以接入手机 AI 的应用权限,手机 APP 以后不仅有一个要求开通知的弹窗,还会出现一个要求接入系统 AI 的弹窗
    marc2017
        53
    marc2017  
       9 天前
    2024 WWDC 上,这个 Siri 的 Demo 才是我对“语音助手”一开始的想象。
    frankilla
        54
    frankilla  
       9 天前 via iPhone
    客气了,这已经很结晶了。
    zisen
        55
    zisen  
       9 天前 via iPhone
    不能抓取微信聊天记录,对国人来说这个功能等于没做
    kekeyu
        56
    kekeyu  
       9 天前
    现阶段的 AI 没一个让我觉得厉害的,更别提苹果的 AI 。目前那些所谓 AI ,我觉的就是个 语音搜索引擎。

    苹果的 AI 演示我看完感觉和没看一样,苹果的 AI 到底有啥用?连用处都没有,谈什么厉害不厉害

    你看看你举的那个例子,先打开一个京东收货页面,然后呼叫 siri 把地址复制粘贴到另一个 APP 里。

    这。。。叫厉害?这叫 AI ?
    maymay5
        57
    maymay5  
    OP
       9 天前
    @zisen 用识图的方案可以强制做到的,但是 APP 情不情愿就不好说了,因为好防,类似支付宝等 APP 后台的毛玻璃
    maymay5
        58
    maymay5  
    OP
       9 天前
    @kekeyu 你认为的 AI 该是什么样子
    jwing
        59
    jwing  
       9 天前
    对于 AI 最期待的是能够改善原生输入法部分
    maymay5
        60
    maymay5  
    OP
       9 天前
    @jwing 无感唤醒 LLM 类的吗,还是纠错,要是能像 copilot 那样智能补全,甚至智能语言转换那就更好了🤣但对我来说输入法太难换了,自从 IOS 8 支持了第三方输入法,我就一直用第三方,现在想换回原生的总是差点意思
    KyrieHuang
        61
    KyrieHuang  
       9 天前
    一个是都是基于英文语境的,另一个是目前还没出 demo 供大家体验。为什么 gpt 出来大家都吹爆了,因为每个人都能体验啊,但苹果的大家还用不了啊

    还有一个方面是对于国人而言,大部分信息都在微信里,能不能获取到微信的内容成了关键。妈妈给我发微信让我记得晒衣服,苹果能获取到并且提示我设置提醒吗,可以的话我吹 3 年,且遥遥领先
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1243 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 17:59 · PVG 01:59 · LAX 10:59 · JFK 13:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.