
适用于看外语视频、直播之类的场景,
不过我个人一般是用来看 Twitch 直播和听 ASMR
项目地址: https://github.com/TheDeathDragon/LiveTranslate
也有视频演示效果,地址: https://www.bilibili.com/video/BV1jQwgzLEjU/
虽然没有商业应用这么准确,但是看个大概还是可以的。
模型的话,推荐用阿里云的 qwen-turbo-latest 速度快,相对准确
以下为截图:


1 zzz22333 3 月 16 日 看着不错,不过有试过 Gemini live 的接口么? |
2 caola 3 月 16 日 看着不错+1 ,可以弄成字幕方式显示最好,类似于酷狗音乐的歌词单行字幕,调整对应显示的大小和屏幕位置后自动隐藏软件本身,相当于悬浮在视频或屏幕上面显示字幕 |
3 MiraiWithRin OP @caola 这个设计之初就考虑不是和字幕一样的,再快还是有两三秒延迟,就和直播间一样的感觉,窗口就只有悬浮窗,然后有个托盘,悬浮窗可以前台置顶的,位置也可以随便拖动,大小颜色都可以设置里面调整 |
4 MiraiWithRin OP @zzz22333 还没有测试过,目前都是用的 OpenAI 标准 |
5 hanguofu 3 月 16 日 via Android qwen-turbo-latest 是怎样计价的啊? |
6 MiraiWithRin OP @hanguofu 看了几个小时直播都没用到五毛钱,用免费的模型额度都完全足够了,但是 qwen-turbo-latest 没有免费额度,其他模型响应基本要 1 秒以上 |
7 afkool 3 月 16 日 先星一下。。这个比 CHROME 自带的识别率高一些。 |