最近在找一种方式,能自动为视频添加双语字幕(比如中英对照),主要用于讲座、课程或播客内容的整理。
理想流程是:
视频中识别出准确的语音转文字( ASR );
同时识别原语种(如英语/西班牙语/意大利语等)+ 翻译成目标语种(如中文);
输出双语字幕,最好是带时间轴的 .srt 或 .ass 格式;
最好可以本地跑,或者有 API 调用方式;
目前看到一些方案,比如:
Whisper + GPT 翻译流程(但翻译质量不稳定且较难控格式);
B 站自带字幕生成功能目前只能出中文字幕,英文字幕不全。
想问下大家有没有:
-
本地部署/自动化脚本推荐?
-
模型调用(比如 openai 、gemini 、claude )有没有现成轮子?
-
或者有没有开源项目能做到稳定双语字幕输出?
感谢!
