寻找飞书妙记(语音转文本)平替? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
jiaqiliu
V2EX    云计算

寻找飞书妙记(语音转文本)平替?

  •  
  •   jiaqiliu 363 天前 3498 次点击
    这是一个创建于 363 天前的主题,其中的信息可能已经有所发展或是发生改变。

    飞书妙记的免费版开始限制 ASR 的时长了(每月 300 分钟)。有没有其他免费的替代品?或者本地部署的也可以。

    https://imgur.com/a/AzL3e7i

    16 条回复    2024-11-13 19:42:47 +08:00
    wkla
        1
    wkla  
       363 天前
    openai whisper.
    阿里达摩院 funasr.
    jiaqiliu
        2
    jiaqiliu  
    OP
       363 天前
    自己简单研究了下,有几个工具,都是离线方案:

    https://github.com/CheshireCC/faster-whisper-GUI
    faster-whisper 的 GUI ,bug 有点多,任务经常卡死,弃

    https://github.com/chidiwilliams/buzz
    也是一些 asr 引擎的 GUI ,比 faster-whisper 稳定,但是在我电脑上无法正常调用 GPU ,弃

    https://github.com/SubtitleEdit/subtitleedit
    主要是一个字母编辑软件,但是其中可以调用自选的底层引擎进行 ASR ,可以正常使用 GPU ,缺点是 ASR 没有进度条,其他还不错目前用的这个。笔记本 4060 ,用 largev3 模型处理一个 90 分钟的视频耗时 15 分钟。
    cyp0633
        3
    cyp0633  
       363 天前
    实现随便你,但是搭配的模型可以试试 belle-large-v3-punct ,在 whisper 基础上微调过效果好多了
    simonsww
        4
    simonsww  
       363 天前
    同找,妙记日常用的还挺多
    janpun
        5
    janpun  
       363 天前
    我也在找,妙记用的很多,企业级应用就是这点不好,我可以接受付款,但绑定了整个大平台的付费我就不想买了,因为我只用这个功能
    pozhenzi998
        6
    pozhenzi998  
       363 天前
    JensenQian
        7
    JensenQian  
       363 天前
    有黄老板显卡的话我用的这个 https://github.com/chidiwilliams/buzz
    JensenQian
        8
    JensenQian  
       363 天前
    @JensenQian https://github.com/chidiwilliams/buzz/blob/main/CONTRIBUTING.md#gpu-support
    默认用的 cpu ,gpu 的话自己看他文档设置,不过得有 cuda

    https://github.com/Const-me/Whisper
    这个支持 amd 的 gpu ,我的 6800H 的核显也能跑,但是好久没更新了
    steelshadow39
        9
    steelshadow39  
       363 天前
    最近看了阿里云的通义听悟,可以试试
    wulv
        10
    wulv  
       363 天前
    通义听悟、钉钉闪记
    Xi
        11
    Xi  
       363 天前
    通义听悟
    linxi7
        12
    linxi7  
       363 天前
    600 块一年,还有 1500 GB 云存储,平时再用用云文档之类的,感觉能回本。
    juicy
        13
    juicy  
       363 天前
    iorilu
        14
    iorilu  
       363 天前
    太多了, 自己折腾可以用 whisper

    或者我开发得 ai 字幕机 (www.aizimuji.com)
    ladeo
        15
    ladeo  
       363 天前
    通义听悟
    s4d
        16
    s4d  
       363 天前
    我用三星手机自带的录音,AI 转录能识别音色,体验很棒。

    这个叫 Galaxy AI 。

    没有使用限制,但是貌似不能上传录音,必须用手机录。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3024 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 33ms UTC 12:49 PVG 20:49 LAX 04:49 JFK 07:49
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86