V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
Jackyxiaoc
V2EX  ›  奇思妙想

有没有朋友想一起拼一个 chatgpt 蓝牙音箱

  •  
  •   Jackyxiaoc · 358 天前 · 5586 次点击
    这是一个创建于 358 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如果是只有一个人玩玩,搞一个能链接 chatgpt 的蓝牙音箱有点划不来,有朋友们想用的么,如果想玩的人多了,就开个团搞搞。预计成本 300 左右。

    产品名称
    chatgpt 蓝牙音箱

    需求描述
    该产品由树莓派和国产蓝牙音箱组成。
    树莓派链接 chatgpt 接口,为用户提供语音服务。
    该 chatgpt 蓝牙音箱服务端部署在用户自身的微软云账号上。
    该 chatgpt 音箱主要用到微软云的 serverless 和语音转换等接口。
    用户第一次使用该 chatgpt 的蓝牙音箱时,需在页面填充 openai 和微软云的 key 。
    该产品无广告。

    产品介绍:这是一款由树莓派和国产蓝牙音箱组成的产品,旨在为用户提供与 ChatGPT 语音服务的连接。它可以通过蓝牙连接到其他设备,使您可以享受到 ChatGPT 提供的语音服务。对于该 ChatGPT 蓝牙音箱,您需要将树莓派与 ChatGPT 接口连接起来,以提供语音服务。 服务端部署在您自己的 Microsoft 云账户上,其中使用了微软云的 serverless 和语音转换等接口。 第一次使用该 ChatGPT 蓝牙音箱,您需要在页面上填写 OpenAI 和 Microsoft 云的 API Key 。我们相信这款产品将会给您带来非常好的用户体验。
    54 条回复    2023-05-08 15:32:18 +08:00
    sakujo
        1
    sakujo  
       358 天前
    是不是聪明一点的小爱音响?那倒是挺不错的
    Jackyxiaoc
        2
    Jackyxiaoc  
    OP
       358 天前
    @sakujo 是的,用来哄哄小朋友什么的,练习下英文对话啥的,看上去还不错。
    sakujo
        3
    sakujo  
       358 天前
    @Jackyxiaoc #2 有点意思 不过如果问它有用的信息它会胡说八道啊 这样没办法当语音助手了
    lloovve
        4
    lloovve  
       358 天前 via iPhone
    你能保证稳定才行,树莓派太贵,直接上 esp32
    demen
        5
    demen  
       358 天前
    其实交互过程感觉挺难受,你问一个问题之后几十上百字的内容用语音播放来听取?平时我们微信聊天看到超过 10s 的语音都有点翻白眼了吧
    mway
        6
    mway  
       358 天前
    有兴趣
    luckjoe680
        7
    luckjoe680  
       358 天前 via Android
    问题是 小爱音箱就能办到了…也用不了 300 啊…
    musi
        8
    musi  
       358 天前 via iPhone
    太贵了,为啥不用手机?
    Tink
        9
    Tink  
       358 天前
    树莓派太贵了
    Tink
        10
    Tink  
       358 天前   ❤️ 2
    这个价格不如买黑板的初代小爱音箱,破解 ssh 后 劫持语音转到 c hatgpt
    jimbray
        11
    jimbray  
       358 天前
    @demen 同意,之前用手机实现了一下语音问答,问一句,答得太多了,用语音播放有点难受,换成文字一下就看完了。纯问答我觉得没有什么意思。
    yuchenxing
        12
    yuchenxing  
       358 天前
    怎么搞
    hoky
        13
    hoky  
       358 天前 via iPhone
    为什么不直接用闲置的手机?
    iPhone 用 Siri
    Android 用 Tasker
    我都试过玩过一阵子
    后来因为直连 openai 响应慢玩的不多了
    totoro625
        14
    totoro625  
       358 天前
    iPhone 安装 OpenCat: https://apps.apple.com/app/opencat/id6445999201
    填入 api key ,开启高级版,并开启 Siri 支持
    任意支持 Siri 的 iPhone/apple watch 均可用 Siri 调用 chatgpt 进行对话
    Biluesgakki
        15
    Biluesgakki  
       358 天前
    如何做到流式传输结果 传回来一个字读一个字呢。不然的话响应时间太长了,需要等到全部返回结果才开始读
    timeance
        16
    timeance  
       358 天前
    1. 树莓派的方案太贵
    2. 硬件部分,基本功能调通,麦克风如何降噪拾音等
    3. 软件部分怎么完善,例如 prompt ,唤醒和本地识别语音指令等

    ... 想法挺好的,要是真有完善的方案 会买一个来玩
    yfmir
        17
    yfmir  
       358 天前
    就目前这 api 的连接环境来看还是算了吧
    littleBink
        18
    littleBink  
       358 天前
    gpt 大部分回答都很长且书面,需要测试大量的 prompt 来优化
    aeli
        19
    aeli  
       358 天前
    反应速度现在还不太行,GPT3 的回答虽然快,也要 1-2 秒,然后再转成语音发声,延迟会感觉比较明显的卡顿。

    GPT4 就不用说了,能正常时间内给你返回就不容易了
    zagfai
        20
    zagfai  
       358 天前
    可以接入米家就行,我不需要很智能,当然,我能给出传感器数据能帮我判断我是不是睡醒,自动开关窗帘,判断我啥时候会回家自动帮我开空调,那也不错。
    ropzislaw
        21
    ropzislaw  
       358 天前 via Android
    这个 idea 我也有过,最后被劝退了
    1. 需求多了生产线怎么弄,如何保证自己的生产线成本低
    2 延迟和输出延迟
    3 实时数据缺失
    Jackyxiaoc
        22
    Jackyxiaoc  
    OP
       358 天前
    @mway 感谢。
    @luckjoe680 小爱的智能水平和 chatgpt 不太一样。
    @lloovve 感谢,我研究下。
    @musi 在家常驻使用比较舒服。
    @Tink 确实是个好办法,感谢。
    @yuchenxing 我研究下路径,如果可以的话,一起拼个单,组好了大家用,成本就下来了。
    @hoky 还是得有稳定的通道。
    @totoro625 长时间接着电源的小音箱在家小朋友什么的好玩。感谢,我研究下。
    @Biluesgakki 流式的话,这个得研究下。大概 10 个字一读会不会好点。
    @timeance 感谢支持,我研究下。
    @yfmir 估计得内置一个通道才行。
    @aeli 目前看是的。看看有没有更好的解决方案。
    @zagfai 如果更智能应该是个更好的体验。
    @ropzislaw 只是一个初步想法,天猫精灵的话二手成本是挺低的。如果单纯是树莓派的解决方案,树莓派也不会很贵。延迟这个通道可以解决。实时数据的话,可以导入谷歌的。

    感谢各位大佬们的建议。
    tags
        23
    tags  
       358 天前
    不错不错,可以先在 linux 虚拟机上把系统搭起来,后面用啥硬件平台可以再说
    Socrazy
        24
    Socrazy  
       358 天前
    Siri 上用了,其实很无聊,简单问题还行,太长的听起来很累
    freetree
        25
    freetree  
       358 天前 via Android
    华强北听到了你的呼求😁
    yulgang
        26
    yulgang  
       358 天前
    想法不错,但是树莓派成本有点高。。
    lambdaq
        27
    lambdaq  
       358 天前
    @Socrazy 可以进一步搞点人设的 prompt 吧
    yulgang
        28
    yulgang  
       358 天前
    如果你能开源的话,大家喜欢,可能会衍生出多个版本,不过一定会有人用你的开源代码拿去赚钱。😂
    Jackyxiaoc
        29
    Jackyxiaoc  
    OP
       358 天前
    @tags 对,可以先测试下反应速度啥的,看看这些问题能否解决。
    @Socrazy 感谢,我先试试。
    @freetree 哈哈哈哈,如果有成品了直接买也是不错,不用自己折腾了。
    @yulgang 树莓派确实成本有点高,不过开源代码拿去赚钱这个国内很常见了。
    @lambdaq 对的。
    dangyuluo
        30
    dangyuluo  
       357 天前
    直接用 Siri 就可以接入 ChatGPT 了
    Jackyxiaoc
        31
    Jackyxiaoc  
    OP
       357 天前 via iPhone
    @dangyuluo 不知道咸鱼上 300 的 6s 能不能跑,如果可以的话,也是不错的选择。
    cloudzqy
        32
    cloudzqy  
       357 天前
    这种自己走微软云文字转语音的,一般用什么方案识别关键字然后开始对话呀,如果一直开着的话,微软云也挺贵的。
    westoy
        33
    westoy  
       357 天前
    做公开服务成本太高了吧

    京东的那个叮咚音箱都倒闭了.......
    zapper
        34
    zapper  
       357 天前
    看了一下(可能是生成的)产品介绍。发现好像没说如何正确地拾音给 chatgpt

    所谓悲观者常常正确,乐观者往往成功。如果能接入插件将绝杀
    tags
        35
    tags  
       357 天前
    唤醒词本地离线模型就能跑
    Jackyxiaoc
        36
    Jackyxiaoc  
    OP
       357 天前
    @cloudzqy , @tags 大佬提供的方案是本地模型去识别关键词。谢谢 @tags
    @westoy 公司去做估计是难,利润空间不大,这个只是想做着自己玩玩的,给家里人也体验下 chatgpt 。
    @zapper 有道理。
    webdesigner
        37
    webdesigner  
       357 天前 via iPhone
    从我使用 gpt 连接 siri 的体验来看,这个项目做出来体验会很差。api 目前要么用 sse 逐字输出,要么牺牲响应时间等待全部结果。逐字输出文字转语音效果会很差,一个一个字朗读。等待全部结果在朗读,用户响应时间特别长,你无法想象当你问完一个问题,就得等待十几秒钟来告诉你答案。如果这个方案可行,大厂早就整出来了。
    hanguofu
        38
    hanguofu  
       357 天前
    @tags : 本地离线模型是指 whisper 吗 ?有没有更好的?
    wellqq
        39
    wellqq  
       357 天前 via Android
    按你目前的阶段,感觉离成品还有一些路要走,不过有出来体验好我会买,有众筹通知一下
    fresco
        40
    fresco  
       357 天前 via iPhone
    一直在找能语音对话的 app ,这个想法不错,成本低点就好了
    luckjoe680
        41
    luckjoe680  
       357 天前 via Android
    @Jackyxiaoc 你可以看看 现在 chatgpt 现在已经有大佬接入小爱了 而且还很方便=.=
    Jackyxiaoc
        42
    Jackyxiaoc  
    OP
       357 天前
    @webdesigner 确实,可能还需要看看有没有更好的方案啦。
    @wellqq 好的,谢谢支持。
    @fresco 嗯嗯,谢谢。
    @luckjoe680 如果有大佬折腾出来卖成品的话就不折腾了,等我看看,之前没看到。感谢提醒。
    aeli
        43
    aeli  
       357 天前
    如果说成品的话,找 amaon 的音箱,它家的很容易开发改第三方,YouTube 上有人放出来教程改 ChatGPT 的
    Smackgg
        44
    Smackgg  
       357 天前
    小爱 小度 自己写一个插件不就做到了?小度六七十块钱就能买到
    xuelu520
        45
    xuelu520  
       357 天前
    需要短平快的对话,gpt 一大堆文字,给你转成语音,太难受了
    xinyana
        46
    xinyana  
       357 天前 via Android
    墙的问题怎么搞定?内置墙?
    xsen
        47
    xsen  
       357 天前
    现在 chatgpt 的模型,只适合用来替代搜索引擎、客服类似的
    用来做 ai 助理(语音对话)是真不合适,长篇大论、废话太多
    cloudzqy
        48
    cloudzqy  
       357 天前
    @tags whisper 感觉中文不太行,同求一个本地模型
    cloudzqy
        49
    cloudzqy  
       357 天前
    @webdesigner 这种可以折中一下,识别到标点符号断句就开始读,一句一句读,比小爱音箱什么的肯定慢,但是应该没十几秒。
    luobogooooo
        50
    luobogooooo  
       356 天前
    笑到了,哈哈哈
    hoopan
        51
    hoopan  
       356 天前
    家里有台待机的 NAS ,增加个麦克风、音响,是不是也能搞成 AI 音箱。

    有基于 chatgpt 的语音助手开源服务端吗?
    swxk521
        52
    swxk521  
       355 天前
    https://space.bilibili.com/452098958
    这人做的感觉不错
    unii23i
        53
    unii23i  
       355 天前
    这个真的很需要!我经常和天猫精灵对线
    zsrex
        54
    zsrex  
       343 天前
    这个我感兴趣,之前折腾了一下 wukong-robot ,但 ubuntu 的系统太难搞了,可能我没有这个基础。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5403 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 07:14 · PVG 15:14 · LAX 00:14 · JFK 03:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.