V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
whoosy
V2EX  ›  程序员

请教关于 Ai 虚拟数字人的问题

  •  
  •   whoosy · 9 天前 · 829 次点击

    请教下 v 友们有没有做过 Ai 虚拟数字人相关的业务,就类似那种在展厅内通过显示设备展示的虚拟人物,能够回答观众的问题,整体流程我之前有过大致的了解,基本上是这样

    语音输入->识别文本->LLM->文字情感分析(想干掉)-> 语音生成 -> 视频生成 -> 驱动数字人 -> 设备展示

    目前大概率是想自己实现整套流程,包括展示设备的对接,有下面几个问题想请教下搞过的 v 友:

    1.整体流程有没有开源的整合方案? 2.展示设备怎么去对接?有合适(便宜好用)的设备推荐吗?

    9 条回复    2024-06-18 09:24:47 +08:00
    Yuhyeong
        1
    Yuhyeong  
       9 天前
    没什么开源的吧。情感分析确实没啥必要感觉。
    我做过数字人聊天的,但是做的是图像生成部分,和你的目标差的比较大,展示设备不就正常大屏幕就可以吗。
    kong0bbs
        2
    kong0bbs  
       9 天前
    云厂商有智能客服,花点钱购买 API ,然后调一下语料库,套个壳子。
    ErnestSu
        3
    ErnestSu  
       9 天前
    思必驰/讯飞(asr)+chatgpt+思必驰/讯飞/微软/百度(tts)+相芯科技数字人
    Hzzone
        4
    Hzzone  
       9 天前
    调 api 吧,你自己实现最多用开源模型,出问题你也不一定有能力解决
    monmon
        5
    monmon  
       9 天前
    流程有点问题,应该先从“谁来买你的设备?”开始,想想这些虚拟数字人在哪些场景比较常见,医院、xx 办事大厅、地铁、商场,如果你能让他们买你的设备,剩下的部分找个差不多的外包公司就做做了
    t41372
        6
    t41372  
       9 天前 via Android
    https://github.com/Ikaros-521/AI-Vtuber
    可以参考一下这个项目吧 我感觉挺猛的
    我自己也在尝试类似的项目,写了一段时间了,不过水平比较菜。
    mmdsun
        7
    mmdsun  
       8 天前
    国内外有很多现成了,想接入 GPT-4 可以用微软的,
    https://learn.microsoft.com/zh-cn/shows/ai-show/advanced-azure-openai-solutions-with-tts-avatar

    不想花钱就找 github 开源方案
    aliyun2017
        8
    aliyun2017  
       8 天前
    前几天刚做的业务 用的腾讯的语音识别转文本 ai 能力:openai ,接受文本结果,文本驱动数字人,
    语音识别: https://cloud.tencent.com/document/product/1240/104050
    数字人: https://github.com/TencentCloud/virtualman-render-demo
    aliyun2017
        9
    aliyun2017  
       8 天前
    @aliyun2017 数字人去控制台定制就可以了,都有免费额度。接入设备大屏那些 一版都是安卓系统,用 h5 开发 套 apk 壳子,后续更新 web 页面就行
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   969 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:49 · PVG 05:49 · LAX 14:49 · JFK 17:49
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.