V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
Branlice
V2EX  ›  分享创造

我做了个用自然语言控制 Mac Demo

  •  1
     
  •   Branlice · 4 天前 · 808 次点击

    做个小工具用说话的方式让 Mac 执行操作。比如「帮我在 YouTube 搜个 Python 教程」,它会自己打开浏览器、找到搜索框、输入、点击,不用你一步步告诉它怎么做。 原理是让大模型看屏幕截图(默认是 OCR/还有一些其他模型支持),然后决定下一步操作。做错了会自己调整。

    挂个链接: https://www.bilibili.com/video/BV1NVBbBDE5K/?vd_source=c91cfe290c1aabe743bd9b89791e23cf

    4 条回复    2025-12-23 10:26:23 +08:00
    zzboat0422
        1
    zzboat0422  
       4 天前
    请问这个语音文字互转是怎么实现的啊?有现成的框架吗?
    jorneyr
        2
    jorneyr  
       4 天前
    @zzboat0422 非常多的 api 可以使用,例如微软的 Azure Speech Service ( Speech to Text ),然后匹配关键词,映射操作(可以使用 Apple Script 执行操作)。
    prefect
        3
    prefect  
       4 天前
    都别吵,影响到我用坚果 TNT 了
    Mark24
        4
    Mark24  
       4 天前
    TNT 棺材板要压不住了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1098 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 17:59 · PVG 01:59 · LAX 09:59 · JFK 12:59
    ♥ Do have faith in what you're doing.