翻译工具 :无字幕视频=>双语字幕,pdf 转 html - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
283810867
V2EX    分享创造

翻译工具 :无字幕视频=>双语字幕,pdf 转 html

  •  1
     
  •  283810867 2018-11-14 16:08:25 +08:00 4147 次点击
    这是一个创建于 2582 天前的主题,其中的信息可能已经有所发展或是发生改变。

    mark

    用 pyqt5 做了一个 windows 小工具 1.无字幕 mp4 视频==>双语字幕 2.英文 srt 字幕文件==>双语 3.pdf 一键转 html


    mark

    mark


    大佬轻喷,脚本只是调用了 4 个开源库

    • autosub:srt 字幕生成
    • ffmpeg:音视频处理
    • pdf2htmlex :pdf 转换
    • pyqt5:图形 GUI 界面

    自己并没有做编码,只是调用 然后将其封装成图形界面和打包 exe 放个下载链接

    链接: https://pan.baidu.com/s/1uUj9fvSWFHu9yjJcx6muoQ 提取码:bryn


    可以加入微信群交流 mark

    简介博客 http://hackorgeek.com/?p=142


    最后,因为七牛云域名回收 所以图床异常 用 markdown 重新发的一篇,见谅 并没有技术,大佬们轻喷

    15 条回复    2018-12-13 09:58:03 +08:00
    dustin2016
        1
    dustin2016  
       2018-11-14 16:25:40 +08:00
    nice
    crab
        2
    crab  
       2018-11-14 16:31:12 +08:00
    试了下 srt 字幕转换,一开始正常,后面就报错翻译异常了。这是调用的谷歌 Translator Toolkit 吗。
    283810867
        3
    283810867  
    OP
       2018-11-14 16:34:57 +08:00
    @crab 可以把报错截图吗,难道是 ip 频率被限制
    调用的是谷歌网页翻译接口
    用 request 请求
    其中最重要的 tk 算法,有大神写了 js 脚本
    设置每句 0.5s 延时,翻译字词语句应该没有问题吧?
    283810867
        4
    283810867  
    OP
       2018-11-14 16:37:18 +08:00
    因为周末业余时间
    会抽时间继续迭代
    补充下永久下载地址
    https://translate.smallzhiyun.com/#/down
    digital2
        5
    digital2  
       2018-11-14 16:39:45 +08:00 via Android
    autosub 好像是自带谷歌 key 的吧?
    ins class="adsbygoogle" style="display: block; height: 72px;" data-ad-format="fluid" data-ad-layout-key="-hs-19-p-2z+is" data-ad-client="ca-pub-5060390720525238" data-ad-slot="1009394990">
    crab
        6
    crab  
       2018-11-14 16:41:56 +08:00
    @283810867 console 界面输出翻译异常的提示。语句没问题,那 srt 通过 Translator Toolkit 正常。估计是被频率限制了,看了下前面翻译了些,后面才开始异常。
    283810867
        7
    283810867  
    OP
       2018-11-14 16:42:28 +08:00
    @digital2 它那个 key 应该是供测试用的
    不能分发大量使用吧
    在另一个开源库,看到针对此密匙的说明:
    说是破解出来的
    但是建议只做测试~~
    283810867
        8
    283810867  
    OP
       2018-11-14 16:45:05 +08:00
    @crab 频率这块我并没与大量测试
    只是设置了每句 0.5 秒延时
    之前写的是调用百度翻译 api,200w 字符免费,
    因为打包分发 exe,就改用了谷歌网页接口
    貌似 XX 上网的代理 ip,不容易被限制
    digital2
        9
    digital2  
       2018-11-14 16:48:33 +08:00
    我记的在 b 站上看到过使用 autosub 的教程,看评论,那个自带的 key 使用应该是没有问题的。
    283810867
        10
    283810867  
    OP
       2018-11-14 16:54:40 +08:00
    @digital2 刚刚也说了,在另一个 translate 开源库
    看到针对此模式的申明
    如果这个 key,没有做限制的话
    那么这个工具内置就完美了
    只是不是 100%确定,必定开源协议,权益等等很敏感
    283810867
        11
    283810867  
    OP
       2018-11-14 16:59:15 +08:00
    @digital2
    https://pypi.org/project/SpeechRecognition/2.1.3/
    这个文档里申明了:
    通用密匙只用于测试和个人目的
    如果用于其他目的,请在谷歌云付费购买自己的 key
    markdown 工具有问题
    没办法截图,你可以看看
    d5
        12
    d5  
       2018-11-16 20:11:00 +08:00 via iPhone
    机器人 eric 学了 python 之后来 b2 了嘛
    283810867
        13
    283810867  
    OP
       2018-11-17 18:32:42 +08:00 via iPhone   1
    @d5 呵呵
    d5
        14
    d5  
       2018-11-17 19:29:01 +08:00 via iPhone
    @283810867 呵呵干嘛...我这个是欢迎的语气啊
    lada05
        15
    lada05  
       2018-12-13 09:58:03 +08:00
    支持一下,上次看到,用不上。今天用上了,重新搜索,又找到这帖了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5187 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 07:22 PVG 15:22 LAX 23:22 JFK 02:22
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86