AI 开发了个《武林外传》全台词检索对应截图网站 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
hugo2233

AI 开发了个《武林外传》全台词检索对应截图网站

  •  
  •   hugo2233 2 月 6 日 1597 次点击
    这是一个创建于 78 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://wulinwaizhuan.hugo2233.dpdns.org/ 文本提取:PaddleOCR (PaddlePaddle 引擎) 暴力破解硬字幕。 数据归档:构建台词-时间戳-图片路径的索引。 抽帧处理:FFmpeg 获取关键帧。 图像预处理:OpenCV + NumPy 提高识别率。

    难题攻克: 针对 TV 录制版没有软字幕的问题,OCR 是唯一解。通过批量推理,将 80 集海量素材转化为可检索的 JSON 文件

    一开始 win 直接运行代码好慢 80min 一集 现在在 wsl 上运行 5-8min 一集舒服了

    参考项目 github 的 Cicada000/VV 感谢指导

    9 条回复    2026-02-10 21:43:25 +08:00
    duuu
        1
    duuu  
       2 月 6 日
    厉害~学习了
    0xo
        2
    0xo  
       2 月 6 日
    是谁杀了我而我又杀了谁
    第 65 集
    34:18
    ---
    这个好像不对
    xkwdm
        3
    xkwdm  
       2 月 6 日
    ![]( )
    hugo2233
        4
    hugo2233  
    OP
       2 月 6 日
    @xkwdm 对的很多 子曰 都是子日
    没有校对
    cadl
        5
    cadl  
       2 月 9 日
    哈哈点子太好玩了,点赞。前几天看到你的帖子,昨天教不会写代码的老婆尝试 claude code ,就是拿这个当例子,搞了个《马大帅》版本的。

    https://biaoleme.llpsh.com/
    hugo2233
        6
    hugo2233  
    OP
       2 月 10 日
    @cadl 好耶
    hugo2233
        7
    hugo2233  
    OP
       2 月 10 日
    @cadl 你这个做的比我好 嘿嘿 识别好准 我还是不少错误哈哈哈 随机一集不错
    cadl
        8
    cadl  
       2 月 10 日
    @hugo2233 哈哈,调试的时候看剧照乐完了。我用的 macOS 系统带的识别做的,在我机器上跑比 PaddleOCR 要快
    hugo2233
        9
    hugo2233  
    OP
       2 月 10 日
    @cadl 我是 win 80min 一集 wsl 5min 一集
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3066 人在线   最高记录 6679   &nbs;   Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 40ms UTC 05:59 PVG 13:59 LAX 22:59 JFK 01:59
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86