上传视频,分离音轨,音轨翻译,字幕合成,最后合并回视频。 音轨分离合并:ffmpeg 音轨转文字:whisper 文字翻译:Azure Translator 文字转音频:Azure text2speech
用 Python ,费用 2k ,不能预支,能搞的留下 base64 。
![]() |
1
yueji 162 天前 ![]() 上传视频,分离音轨,音轨翻译,字幕合成,合并视频
ffmpeg 音轨转文字 whisper 文字翻译 Azure text2speech 每一个功能接包都值 2k. |
![]() |
2
nikenidage1 162 天前
费用 2k
|
![]() |
3
psklf 162 天前
加个 0 吧
|
![]() |
4
danbai 162 天前 via Android ![]() 谁在这留联系方式我看不起谁
|
![]() |
5
iorilu 162 天前
需求也不清楚
写个脚本凑合用 和写一个能用的软件带 UI 的差远了 |
![]() |
6
gzlock 162 天前 ![]() ffmpeg -i input-video.avi -vn -acodec copy audio.aac
whisper audio.aac --model medium --output_format vtt -o . Azure Translator 没用过 Azure text2speech 也没用过,话说把翻译后的字幕转音频是啥需求?帮视频配音? 正巧前两个需求我都用过,帮楼主省了有 1k 吧,[滑稽 |
![]() |
7
shalingye 162 天前 via Android
没什么难度,不过为啥非得 Python 写界面,还有楼上一堆嘲讽的看不懂
|
![]() |
8
iorilu 162 天前
@shalingye 难度是不高
这活其实问下 chatgpt 基本就完成 70%工作量, 剩下调试下脚本就通了 但 lz 估计是要搞个网页的, 那活就没底了, 还得搞页面,css ,html , 前端一堆玩意 |
![]() |
9
xiangyuecn 162 天前
@shalingye 2k ≈ 打发要饭的,除非拿来练手 打发时间🐶 尤其是:不能预支 == 画饼,订金 预付款都没有,说白嫖都不为过 陌生人。
|
![]() |
10
iorilu 162 天前
@gzlock 自动配音啊
现在自媒体搞得很多垃圾视频都是这么出来的, 先从 youtube 活什么地方搬运, 然后分离声音, 搞个字幕, 再按字幕 AI 配音, 最后再合成 都是 AI 配音, 一个叫云溪的男的声音, 都听过把 |
![]() |
12
gpt5 162 天前
v 友平均工资几万刀,
按业界统一标准,工资时薪两倍算, 你这没几十万刀根本打不住。 |
![]() |
13
shalingye 162 天前 via Android
@xiangyuecn @iorilu 受教了🤣
|
14
nightwitch 162 天前 via Android
加个 0 都打不住
|
15
x77 162 天前
其实不用这么麻烦,Azure Speech 可以直接从音频到音频,不需要 STT 再 TTS ,流程如下:
Video --> (FFmpeg) Audio Track --> (Azure Speech Service) Speech Translation --> (FFmpeg) Audio Track 2 --> Video 2 当然,如果楼主非要要 AI TTS 播音就另外当别论了 |
16
jackge0323 162 天前
这种一看就是搞国外教程的,udemy 的教程拖回来,翻译成中文,再拿出去卖。
|
17
ndk2023 162 天前
预算翻一倍叫我。
|
![]() |
19
murmur 162 天前
自动洗稿?有这技术早自己干了
|
![]() |
22
nmap 162 天前
侮辱性定价
|
24
xylophone21 161 天前
|
![]() |
25
c2const 161 天前
建议把预算提高到 2k dollar
再签好合同,提前预付部分款项 ---------------- |
![]() |
26
looveh 161 天前
就知道一个 ffmpeg ,其他的都没听过(꒦_꒦)
|