V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
mocococ
V2EX  ›  分享创造

最近发现 github 上新出了一个 Python 的文本转语音 日常对话的生成式语音模型工具 才 3 个月 快 30K 的 star

  •  1
     
  •   mocococ · 72 天前 · 2709 次点击
    这是一个创建于 72 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://github.com/2noise/ChatTTS

    A generative speech model for daily dialogue.
    11 条回复    2024-08-30 19:20:17 +08:00
    ab
        1
    ab  
       72 天前 via iPhone
    star +1
    tianhehechu
        2
    tianhehechu  
       72 天前
    star + 1;
    ferock
        3
    ferock  
       72 天前 via iPhone
    好东西,我一直很好奇,为什么,没有一个开源模型可以让大家一起提供训练接口…比如,微信导出一个聊天记录,本地训练,贡献数据。类似于,比特币这种…
    leokun
        4
    leokun  
       72 天前   ❤️ 1
    @ferock 我把你的文字转语音了,可以听一下 : https://dzkaka-chattts.hf.space/file=/tmp/gradio/ac3428528f51d20322af82e0f7db9559c6de6caf/audio.wav
    freshgoose
        5
    freshgoose  
       72 天前   ❤️ 1
    巧了,我还给它做了个在线体验的网站: https://chattts.in/zh
    andforce
        6
    andforce  
       72 天前
    之前就在 B 站看过各种爆吹的视频,确实牛逼。

    这东西能实时转语音吗?
    jatesun
        7
    jatesun  
       72 天前
    @leokun #4 有点强啊这个口音
    yuewolf
        8
    yuewolf  
       72 天前
    很自然。厉害了!!
    @freshgoose 这个也好。
    Frankcox
        9
    Frankcox  
       72 天前
    我更喜欢用 GPT-Sovits ,之前用游戏提取台词做训练,大概不到半个小时就可以基本完美复刻一个人音色。而且前一阵的 v2 版本也大幅度解决了吞字的问题。目前唯一毛病就是情感和部分语调高低处理了。
    www12222
        10
    www12222  
       72 天前
    我试了英语很容易错字,吞字,整体质量完全靠随机,如果要高强度使用建议还是上微软的 azure ,配合 gpt 生成 ssml ,出来的效果也挺好的。
    bijue
        11
    bijue  
       71 天前 via Android
    基于这个项目的其他项目,我下载了 2 个
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1671 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 16:48 · PVG 00:48 · LAX 08:48 · JFK 11:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.