有哪些方式可以解析 B 站、抖音的视频的文本? - V2EX
请不要在回答技术问题时复制粘贴 AI 生成的内容
Zizpop

有哪些方式可以解析 B 站、抖音的视频的文本?

  •  
  •   Zizpop 18h 5m ago 1225 views
    刷视频的时候经常听到一些醍醐灌顶的观点,但是视频收藏起来之后就很难找到、或者说索引出来。

    要是能解析成文本保存到笔记中就好了。

    V 友们,知道有什么效率高、成本低的方案吗?
    11 replies    2026-05-15 10:02:26 +08:00
    BlueBing
        1
    BlueBing  
       17h 26m ago
    你问下 ai ,它会帮你安装音频转文字,再帮你提炼。
    豆包也可以提炼抖音视频的内容
    Mzs
        2
    Mzs  
       17h 25m ago
    ooooo00000ooooo
        3
    ooooo00000ooooo  
       16h 16m ago
    yt-dlp 下载音频, 本地大模型 ASR 转文字。
    RW5kZXJBdmFyaXRp
        4
    RW5kZXJBdmFyaXRp  
       14h 40m ago
    用 wispher 模型转换一下?
    pakro888
        5
    pakro888  
       14h 26m ago
    抖音可用豆包

    longlonglanguage
        6
    longlonglanguage  
       14h 5m ago
    这么巧,今天刚发现了一个,https://github.com/moonjoin/tampermonkey-scripts 。这个作者写了三个插件,一个是 bilibili 总结,一个是网页总结,另一个可以把总结内容加入到某笔记的插件。需要自己添加 ai 的 key ,不过在作者的 github 最下方有推荐,小米的 ai 有推广活动,填写作者的推荐码,可以获得 10 元的体验。我就不厚脸皮发我的推荐码了,建议填一下作者的算是对作者的支持了。
    Vinceli2401
        7
    Vinceli2401  
       13h 53m ago
    yt-dlp + whisper + 随便找个 LLM 总结 自己写个脚本感觉不会很难
    AastroLula
        8
    AastroLula  
       13h 3m ago
    如果大部分的内容都是文字稿转视频配上动画的,确实语音转文字是个不错的省流方案,要是配合本地语音模型加上 llm 感觉是个不错的方案,先 mark 回头手搓一个
    sentinelK
        9
    sentinelK  
       5h 16m ago
    绝大多数的“总结”方案都是直接扒字幕的。

    也就是说,如果你要的视频观点、内容主要以语言的形式呈现,那么效果就不错。
    如果是以视觉效果呈现,成本就比较高了。

    举个例子,比如有的 up 喜欢说“结论如图”/“自己截屏查看”,这种情况市面上的“总结”方案就做不到。
    isnullstring
        10
    isnullstring  
       4h 57m ago
    @sentinelK 对的,有些视频没有字幕或者某些敏感内容只有语音没有字幕时候就缺失
    isnullstring
        11
    isnullstring  
       4h 37m ago
    找 AI 做一个呗,不过用 whisper 转录最好有显卡,纯 CPU 转不是一般的慢,往往是音频时长的 3 倍
    一个使用 yt-dlp 自动下载,一个扫描下载目录按预设参数和提示词生成笔记

    https://imgur.com/a/JGdENKm
    About     Help     Advertise     Blog     API     FAQ     Solana     5833 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 44ms UTC 06:39 PVG 14:39 LAX 23:39 JFK 02:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86