V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
eightdoor
V2EX  ›  分享创造

使用 whisper 制作音频转文字网站

  •  
  •   eightdoor · 215 天前 · 1818 次点击
    这是一个创建于 215 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前实现

    • 使用 openai/whisper python+fastapi 实现音频、视频文件上传,后台通过 whisper 转换文字内容 存储数据库,通过定时任务,后台自动转换,目前只支持单个转换 不能并行转换

    计划

    其他

    • 目前服务器是通过 frp 内网直接代理出去的,配置 e5+amd580 (搭配 rocm ),运行的模型大小是 medium 。如果有盈利点,可以买点好的配置服务器
    • 目前只想到这样做,可以后续提供 api 接口直接调用,提供付费服务。
    • 不知道想法是否可行,能不能产生盈利点,大家有什么好想法或者建议吗
    21 条回复    2023-09-25 17:20:50 +08:00
    jayzau1973
        1
    jayzau1973  
       215 天前
    你可以搜搜之前有个老哥做的 AI 字幕机,实现了盈利。
    不过他是打包成软件,用客户端资源进行计算,你这用自己的服务器成本会不会太高?
    z7356995
        2
    z7356995  
       215 天前 via Android
    我是用 google colab 免费 gpu 计算,速度快
    UKnowMe
        3
    UKnowMe  
       215 天前
    1. “目前只支持单个转换 不能并行转换” 这个指的是用户 A 每次只能转换 1 个,还是说用户 A 、用户 B 、用户 C 加起来只能转换 1 个,若 A 转换中,则 B 、C 阻塞?

    2. 你有什么比得过 https://freesubtitles.ai/ 的?无恶意,单纯觉得人家已经有了你所说的 “后续提供 api 接口直接调用,提供付费服务” ,那么是否意味着你比人家的功能还少?莫非你打算通过推广来赢得市场还是啥?

    3. 免费用户一直用脚本调用你的功能,你咋办?因为我正好有音频转文字的需求,未登录的用户,你该如何防止?还是说需要登录才能使用功能,通过登录用户来进行精准限制。
    molezznet
        4
    molezznet  
       215 天前
    580 传家宝啊
    z7356995
        5
    z7356995  
       215 天前 via Android
    其实赢利点不是音频转换,而是英语有声书网站,有很多有名的英语有声书,要嘛找得到 mp3, 要嘛找不到对应的逐句复读的材料,国外有一个 pt 有声书网站,可以下载各种有声书,然后提取转换 srt 字幕,就可以供英语学习者边看有趣的内容边听了,下什么内容转换可以按搜索量,或有偿加速,版权问题,,你看看每日英语听力,有几个音频字幕买了版权?
    z7356995
        6
    z7356995  
       215 天前 via Android
    国外 pt 网站可以下载 mp3
    z7356995
        7
    z7356995  
       215 天前 via Android
    一次转换可以多次贩卖
    eightdoor
        8
    eightdoor  
    OP
       215 天前
    @jayzau1973 我找找看看,服务器成本很高,要是转换的话
    qW7bo2FbzbC0
        9
    qW7bo2FbzbC0  
       215 天前
    如果 使用者传入涉政暴恐的录音,并且进行关联传播,你有做关键词屏蔽和错杀恢复逻辑吗?
    qW7bo2FbzbC0
        10
    qW7bo2FbzbC0  
       215 天前
    如果你使用墙内的基础设施提供服务,如果不幸被关联到非法信息使用上,很快会被查水表吧
    eightdoor
        11
    eightdoor  
    OP
       215 天前
    @UKnowMe 1 、同时只能转换 1 个。2 、freesub 做的已经比较好了,我的功能是比较少的,看看有没有小众的需求,做免费的也可以。3 、通过登录可以转换,但是还是免不了 接口恶意调用,加安全策略。
    eightdoor
        12
    eightdoor  
    OP
       215 天前
    @z7356995 这个不错 有声书或者现在好多的免费视频 字幕也可以做
    zhch602
        13
    zhch602  
       215 天前
    现在 whisper 的入门门槛太低了,免费的客户端软件也有很多,用服务器的话可以白嫖 google colab ,看不到什么盈利点
    eightdoor
        14
    eightdoor  
    OP
       215 天前
    @qW7bo2FbzbC0 应该去筛选的 上传完成了,转换完成了 关键词屏蔽和错杀恢复逻辑。 其实最好的还是做个客户端工具 利用本地资源去转换 我看 whisper 有几个开源的是可以 window 或者 mac 端直接使用的
    tool2d
        15
    tool2d  
       215 天前
    whisper 的模型英文识别度高,但是中文效果挺一般的。
    anmie
        16
    anmie  
       215 天前
    会做实时转录吗?
    thinkm
        17
    thinkm  
       215 天前
    门槛太低了,全是开源的,是几行命令的事情,就算能盈利,马上一大堆人来价格比你低 配置比你好
    z7356995
        18
    z7356995  
       215 天前 via Android
    模式参考每日英语听力,但收集各种推荐书单,做好各种阅读量高的书的 seo ,然后流量的话,人家找书搜索书名的话就到你的网站下来了,,网站做好信息隔离,,万一有人告,要找不到人
    xyy003
        19
    xyy003  
       215 天前
    基本没有盈利点
    eightdoor
        20
    eightdoor  
    OP
       215 天前
    @anmie 会做
    eightdoor
        21
    eightdoor  
    OP
       215 天前
    @z7356995 说的对,感觉做网站 不如直接做客户端实在啊,服务器数据做了存储 就有很多问题
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   876 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 20:12 · PVG 04:12 · LAX 13:12 · JFK 16:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.