有没有浏览器插件可以把视频教程直接变成文本? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
aeli
V2EX    程序员

有没有浏览器插件可以把视频教程直接变成文本?

  •  
  •   aeli 221-06-09 15:05:33 +08:00 6275 次点击
    这是一个创建于 1593 天前的主题,其中的信息可能已经有所发展或是发生改变。
    感觉看视频教程太占时间,有没有可以直接将视频里的声音通过语音识别直接转成文本的浏览器插件或者工具?
    58 条回复    2021-06-11 09:44:38 +08:00
    lostSoul
        1
    lostSoul  
       2021-06-09 15:18:11 +08:00   11
    这是一个浏览器插件能搞定的问题吗?????
    Dockerfile
        2
    Dockerfile  
       2021-06-09 15:19:22 +08:00
    为什么不直接看书?
    no1xsyzy
        3
    no1xsyzy  
       2021-06-09 15:19:39 +08:00   2
    你需要全部拉下来然后才能转(
    而且我认为不如直接找文本教程,视频教程质量中位数和平均值均较低
    madpecker009
        4
    madpecker009  
       2021-06-09 15:19:53 +08:00
    没有 要不你写个?
    aeli
        5
    aeli  
    OP
       2021-06-09 15:21:46 +08:00
    @lostSoul 视频网站的流显然可以由插件来处理,需要做的比视频网站视频下载工具更多一步语音识别的步骤而已。
    jorneyr
        6
    jorneyr  
       2021-06-09 15:25:47 +08:00
    讯飞提供了上传音频提取音频的文本在线服务,有钱就行。
    视频提取音频很容易,随便找个工具就成。
    jr55475f112iz2tu
        7
    jr55475f112iz2tu  
       2021-06-09 15:26:56 +08:00
    你觉得这种类型的操作,有插件可以免费给你做?
    那请自己做一个吧
    liuser666
        8
    liuser666  
       2021-06-09 15:27:52 +08:00   10
    @aeli 既然您说了“而已”,那就只能请您亲自出马了。
    aeli
        9
    aeli  
    OP
       2021-06-09 15:32:35 +08:00
    @czfy 我也没说找免费服务和工具吧?
    aeli
        10
    aeli  
    OP
       2021-06-09 15:34:37 +08:00
    @jorneyr 这种需要手动处理的太多,我先要把视频站的流下载,再转音频,再去上传。不过如果没有合适的工具,就只有自己动手了。
    Eytoyes
        11
    Eytoyes  
       2021-06-09 15:41:54 +08:00
    如果一些语义错误的话还要去倒视频,感觉反而变得麻烦了
    mlhorizon
        12
    mlhorizon  
       2021-06-09 15:51:20 +08:00   1
    试试几款给视频加字幕的软件就明白了,这活不简单。
    xingshu1990
        13
    xingshu1990  
       2021-06-09 15:54:25 +08:00
    @Eytoyes #11 很多人苦于 SEO 没内容,而视频中的内容呢,多数是小编编写的,所以很多人瞄向这块内容。
    讯飞或者百度之类(未查询)的有这块方面的 API,通过提交音频,然后去转成文字。
    视频下载呢,有嗅探类软件。
    格式转换类工具,比如格式工厂 可能可以直接转音频。
    转换好的音频呢,通过 python 编写脚本代码,将其输出保存为文字的话,也很方便,网络上有很多类似的教程。
    xingshu1990
        14
    xingshu1990  
       2021-06-09 15:55:30 +08:00
    哦 对了 ,上面说的这个方法,估计仅限于汉语而且是标准普通话,不保证准确度。
    lostSoul
        15
    lostSoul  
       2021-06-09 16:13:17 +08:00
    @aeli 请您写一个造福大家吧
    jingslunt
        16
    jingslunt  
       2021-06-09 16:18:23 +08:00
    一帧一帧的载下来吗
    Keyes
        17
    Keyes  
       2021-06-09 16:39:06 +08:00 via iPhone
    @xingshu1990 这类内容农场,机智
    nexmoe
        18
    nexmoe  
       2021-06-09 16:43:24 +08:00
    淘宝有相关服务
    xingshu1990
        19
    xingshu1990  
       2021-06-09 16:45:05 +08:00
    @Keyes #17 关于内容农场:还有知网、万方、维普等之类的东西。

    现在 5118 的内容规划神器免费开放了,又是一个内容编写利器。

    百度站长工具后台的关键词规划师,谷歌站长工具后台的关键词规划师,百家号里也出了一个关键词工具,同时还能搜索其他包含这块内容的文章。
    soraginko
        20
    soraginko  
       2021-06-09 16:46:10 +08:00
    可以做到但没必要,所以没有
    dewo4e
        21
    dewo4e  
       2021-06-09 16:48:59 +08:00
    视频本身提供字幕的话,好解决
    像 youtube 大部分视频都可以
    到 greasyfork 下个脚本就行了
    tangchi695
        22
    tangchi695  
       2021-06-09 16:52:29 +08:00
    视频上传油管,生成字幕,下载,完事儿。
    tutustream
        23
    tutustream  
       2021-06-09 16:56:35 +08:00
    LZ 这个需求真的可以,不过只靠插件不行。

    具体 ls 也说了,就是 2 步,上传油管,下载字幕(有只下载字幕的网站)。
    dengji85
        24
    dengji85  
       2021-06-09 17:14:39 +08:00
    提取了正确的文字也没用把,人家教程就是图文合一的
    hikarugo
        25
    hikarugo  
       2021-06-09 17:30:09 +08:00   2
    浏览器插件过分了,能读取到 stream 并解析,这和之前 v2 大火的那位提供免广告观看视频有异曲同工之妙。而且语音识别这种工作量你让一个插件跑? 5 分钟的视频让 js 跑个 10 分钟可能还在跑,既侵权+做的事又没意义,楼主就是典型的眼高手低,指点江山。
    libook
        26
    libook  
       2021-06-09 17:42:39 +08:00
    那种可以用文字简单直接说明白的信息,如果是以视频的形式提供我基本不会看,特别是通勤的时候,听旁白还要找耳机。

    视频作为一种媒体形式是可以承载文字难以承载的内容的,比如动画演示和实验实拍,这种得自己能看懂视频的 AI 才能转换成文字描述。

    所以现阶段能实现的就是把音频进行语音识别,不过考虑到我关注的视频号都是能充分发挥视频媒体特性的,估计这种功能对我来说没啥用。
    yiqiao
        27
    yiqiao  
       2021-06-09 17:43:36 +08:00
    方案一:autosub 可以看下。我用过,识别率有点低。
    方案二:ffmpeg 转音频后找在线转换的,例如百度,讯飞。网易。我之前用过网易的见外免费的,https://jianwai.youdao.com/index/0
    dss886
        28
    dss886  
       2021-06-09 18:04:36 +08:00
    muzuiget
        29
    muzuiget  
       2021-06-09 18:55:28 +08:00
    无非就是语音识别出字幕,只不过不需要时间轴,建议发起幻想,成本不低,所以没人做。
    ShareDuck
        30
    ShareDuck  
       2021-06-09 19:06:37 +08:00
    认同 3 楼的这个观点:“而且我认为不如直接找文本教程,视频教程质量中位数和平均值均较低”。
    Youtube 本身就能做到提取整个视频的全部字幕(语音识别),但即使能做到,也达不到楼主的目的。首先,语音识别成文字,肯定存在一定的错误率,尤其是专业词汇,影响理解。第二,大部分视频教程,是语音配合画面的动作来解释的,你单纯看字幕,是无法获取到作者的意思的。
    lysS
        31
    lysS  
       2021-06-09 19:09:33 +08:00   4
    哟,又有产品来逛 v2 了
    jfdnet
        32
    jfdnet  
       2021-06-09 20:40:44 +08:00
    视频里面的音频只是做辅助用的,转成文字也没有用。
    aeli
        33
    aeli  
    OP
       2021-06-09 21:02:01 +08:00
    @tutustream 并不是,有字幕我直接提取字幕就行,有很多视频是没有字幕的。

    @dss886 看介绍这个似乎真的可以,试用一下,多谢。

    另外,不明白这种冷嘲热讽,不行你上的风气那里来的,我只是因为一个比较小众的需求来找找现成市场有没有解决方案,这里不讨论深度的东西,就打字嘲讽很有意思?
    aeli
        34
    aeli  
    OP
       2021-06-09 21:06:30 +08:00
    @fyxtc 你知道有个词叫 api 嘛?又不是让 js 插件自己去做语音识别。另外可能我标题里只有插件一个词,你就没看看正文里还有“或工具”这个选项?
    aeli
        35
    aeli  
    OP
       2021-06-09 21:07:29 +08:00
    @jingslunt 视频流你可以理解为被分割成只包含几 s 缓冲小段小段的视频文件,一般视频网站的下载工具就是下载再格式转换成 mp4 。
    directorliu
        36
    directorliu  
       2021-06-09 22:22:43 +08:00 via iPhone
    我用 autosub 加讯飞接口做字幕都想吐,人工校对也有不少工作量
    pxmxxp
        37
    pxmxxp  
       2021-06-09 22:31:43 +08:00
    这个解决方法和自动添加字幕是一个原理,可以参考这个
    https://github.com/wxbool/video-srt-windows
    rb6221
        38
    rb6221  
       2021-06-09 22:45:30 +08:00
    你的视频必须有如下特征
    普通话标准
    专业术语易于识别
    全程语音占的比重大,如果某些台词就是“如下图所示”请问你怎么转
    更重要的是,你本来可以直接找一篇相同主题的文章去看的,请给我个理由非要用这个视频转一遍
    rb6221
        39
    rb6221  
       2021-06-09 22:46:17 +08:00
    @janus77 #38 哦对了,还有中英文混杂、英文简称(伪简称)、校对等工作来做
    Rabbircantknow
        40
    Rabbircantknow  
       2021-06-09 22:49:25 +08:00 via Android
    chrome 在播放声音的时候,右上角的插件栏会有一个像是播放列表的图标,点开之后会有个实时字幕的选项,开启选项后,会出现一个黑色底的窗口,实时的将音频中的话识并展示别出来。
    wellsc
        41
    wellsc  
       2021-06-09 22:52:06 +08:00 via iPhone
    @lostSoul 写个抓取 youtube 字幕的插件就可以
    hikarugo
        42
    hikarugo  
       2021-06-10 09:22:54 +08:00
    @aeli 你真的挺搞笑的,标题写着插件,然后正文加工具,我就针对你说的标题一部分做回答有问题吗?你说要 A 方案和 B 方案,我回答说 A 方案就是秀逗,有什么问题呢?说难听点,这种插件想法提问就是没过脑子的,伸手党是有当多习惯? B 了
    superszy
        43
    superszy  
       2021-06-10 09:28:45 +08:00
    我以为,视频的意义在于某些 不愿意 /不方便看书 或 某些文字不易描述 的场景
    这把视频再转成文字,反而又损失一部分信息,那干嘛不直接看书呢?
    aeli
        44
    aeli  
    OP
       2021-06-10 10:02:34 +08:00
    @fyxtc 你自己是秀逗还来展示自己的秀逗?这个需求上面也有很多人说,本身就是可以通过插件实现的,只是你自己夸大它的技术难度。又不是让插件自己来完成所有的工作,插件只是整合不同 api 提供的能力。


    @superszy 并不是,很多网课资源,本身是没有文字的,网课的课程转成文字,配上课件,损失的信息量其实并不多。
    aeli
        45
    aeli  
    OP
       2021-06-10 10:03:34 +08:00
    @janus77 很简单的需求,斯坦福的网课,麻烦你找一个相同主题的文字内容给我?
    jingslunt
        46
    jingslunt  
       2021-06-10 10:13:51 +08:00
    @aeli 分割成一段一段也不是文本。
    我觉得可行的办法是先给视频配上字幕,然后根据字幕一帧一帧转成图片,然后再把图片呈现的信息和字幕描述成一段文字,自然就成了文本。视频>>逆向成>>小说
    learningman
        47
    learningman  
       2021-06-10 10:17:52 +08:00
    @aeli #33 因为这里是程序员的社区,程序员的风气就是你行你上。
    xieqiqiang00
        48
    xieqiqiang00  
       2021-06-10 10:39:16 +08:00   1
    https://www.videoindexer.ai/
    微软有这个服务,不过得自己上传视频
    xieqiqiang00
        49
    xieqiqiang00  
       2021-06-10 10:41:46 +08:00   1
    xieqiqiang00
        50
    xieqiqiang00  
       2021-06-10 10:44:34 +08:00   1
    [![2gwySH.png]( https://z3.ax1x.com/2021/06/10/2gwySH.png/a>)]( https://imgtu.com/i/2gwySH)
    可以自动根据画面分割,然后配文字描述
    zhw2590582
        51
    zhw2590582  
       2021-06-10 12:12:03 +08:00
    可以,最近在做一个给视频实时添加智能字幕的插件,和你这个需求差不多
    lonr
        52
    lonr  
       2021-06-10 14:40:00 +08:00
    Chrome 桌面版的“多媒体控制”在测试实时字幕,不过只支持英文
    aeli
        53
    aeli  
    OP
       2021-06-10 15:43:49 +08:00
    @dss886 感谢感谢,这个确实好用。。

    试了一下,中英文混合的效果都很不错。
    https://meetings.feishu.cn/minutes/obcndo7y9iyk1m1u34o47f7e
    aeli
        54
    aeli  
    OP
       2021-06-10 15:57:42 +08:00
    @learningman 你行你上的意思是在指责别人不行的时候,自己要知道怎么可行。而不是在这全世界各种解决方案都已经有的时候,在这里就凭自己井底的思想局限认为自己做不到,别人一定做不到。
    learningman
        55
    learningman  
       2021-06-10 16:59:15 +08:00 via Android
    @aeli 因为很显然你缺乏必要的常识,js 干不了这事,包括其他人提供的那些可能有帮助的,肯定也不是 js 写的。
    你加上了浏览器插件这个前缀,再接上后面这个条件。其他人本来就没可能提供给你任何有意义的回答了。
    aeli
        56
    aeli  
    OP
       2021-06-10 17:43:17 +08:00
    @learningman 嗯,我没常识,不知道你这种限定 js 干不了这种工作的思想,被其他大佬听到会怎么想。js 是完成不了这里面那一步工作呢?
    - 下载视频
    - 上传到 api 接口
    - 获取 api 结果
    learningman
        57
    learningman  
       2021-06-10 23:06:43 +08:00
    @aeli #56 “有没有浏览器插件可以把视频教程直接变成文本?”
    你自己问的
    Myprajna
        58
    Myprajna  
       2021-06-11 09:44:38 +08:00
    我已经在用网易见外转播客内容了。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2606 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 31ms UTC 07:58 PVG 15:58 LAX 00:58 JFK 03:58
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86