V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
oix
V2EX  ›  问与答

临时需要高质量的语音转写(普通话),有什么好办法?

  •  
  •   oix · 2022-12-20 23:48:45 +08:00 via Android · 1344 次点击
    这是一个创建于 730 天前的主题,其中的信息可能已经有所发展或是发生改变。

    需要转写一段访谈录音。请问有什么好用的网站、应用或者好部署的 demo ?最好支持说话人识别的。

    8 条回复    2022-12-21 19:27:44 +08:00
    longbye0
        1
    longbye0  
       2022-12-21 00:04:14 +08:00 via iPhone
    vosk 离线的。

    语音识别和说话人识别是两个问题。
    oix
        2
    oix  
    OP
       2022-12-21 00:11:14 +08:00 via Android
    @longbye0 就是希望那种自动识别出哪段话是谁说的。类似“小明:你叫什么?小红:我叫小红。”
    Vancion
        3
    Vancion  
       2022-12-21 05:22:45 +08:00
    字节的飞书妙记是免费的。我记得可以区别说话人。其他还有网易见外。科大讯飞的好像淘宝有便宜的。
    dongpeng121
        4
    dongpeng121  
       2022-12-21 07:27:12 +08:00 via iPhone
    腾讯云有免费的语音转文字服务,每月 10 小时,可以区分说话的人
    shervy
        5
    shervy  
       2022-12-21 09:11:12 +08:00
    微信键盘不是就可以直接语音转文字了
    jifengg
        6
    jifengg  
       2022-12-21 10:08:06 +08:00
    whisper ,
    优点:离线、有多个精度模型可选、准确率高、带时间点;
    缺点:只用 cpu 耗时较久(几倍原时长的耗时)、没有说话人识别;
    最好:有 n 卡可以使用 cuda 加速。
    oix
        7
    oix  
    OP
       2022-12-21 11:52:35 +08:00 via Android
    @shervy 微信键盘的好像是语音输入,这个跟转写不是同一个应用
    datocp
        8
    datocp  
       2022-12-21 19:27:44 +08:00 via Android
    Google 的 实时转写 app 。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5286 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 08:30 · PVG 16:30 · LAX 00:30 · JFK 03:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.