求推荐一个应用可以将音频文件转成文本 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Amose2024
V2EX    问与答

求推荐一个应用可以将音频文件转成文本

  •  
  •   Amose2024 251 天前 1374 次点击
    这是一个创建于 251 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人业余时间修了个管理方向的硕士学位,经常需要看视频课程或者听音频课程,有的时候一堂课甚至超过 4 个小时。不想听,觉得看起来快多了。求一个应用,可以让我快速上传大文件,并且很快转成文本内容。

    感谢

    11 条回复    2025-02-08 21:48:24 +08:00
    tpxcer
        1
    tpxcer  
       251 天前
    达芬奇
    loading
        2
    loading  
       251 天前
    通义可以转,还会总结。很多 AI 应用都具备这种功能了。
    Amose2024
        3
    Amose2024  
    OP
       251 天前
    @loading @tpxcer 谢谢。请问对于两个 G 大小的文件也可以处理吗?其实这种要上传就是比较麻烦的事情了
    loading
        4
    loading  
       251 天前
    建议通过其他软件,单独将音频剥离出来。如果是在线看的视频,甚至有机器人帮你完成,像通义,我只要给播客的地址,它就能做完,不用我上传。
    404neko
        5
    404neko  
       251 天前   1
    那肯定是 Whisper 了
    paopjian
        6
    paopjian  
       251 天前   2
    直接 pip 安装 buzz,启动 buzz 就可以用 whisper 模型做提取声音识别字幕了,安装 pytorch 还可以调 gpu 加速
    Amose2024
        7
    Amose2024  
    OP
       251 天前
    @loading 音视频都是需要登录验证的,给链接,通义怕是访问不了。
    @404neko @paopjian 我是有办法把音视频文件下载下来。没搞过 Whisper ,可以试试本地跑跑。谢谢
    iaiuse
        8
    iaiuse  
       251 天前 via iPhone
    飞书妙计。跑不了的
    Amose2024
        9
    Amose2024  
    OP
       251 天前
    @paopjian @404neko 果然可行,准确度异常的高,十分感谢~
    lneoi
        10
    lneoi  
       250 天前
    围观看看, 本地有好多音频, 也想整理成文字, 有的还是方言, 以前找的很多识别软件都是太长音频不支持, 要不然就是收费非常贵
    tpxcer
        11
    tpxcer  
       249 天前
    @Amose2024 可以
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5361 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 01:19 PVG 09:19 LAX 18:19 JFK 21:19
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86