有什么办法可以批量根据 mp3 内容快速分类的 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
hikarugo

有什么办法可以批量根据 mp3 内容快速分类的

  •  
  •   hikarugo Jun 23, 2022 2180 views
    This topic created in 1404 days ago, the information mentioned may be changed or developed.
    每个 mp3 音频大概 10 秒左右,需要人听才能分类到 1,2,3
    人工操作就是把所有 mp3 拖到播放器然后播一个,再去文件管理器复制粘贴,得弄死

    目前想到一个思路自己写脚本命令行逐个播放( ffmpeg?),然后根据听到的内容(不用听完,可能 3 秒或 5 秒就能分辨)按键盘 1,2,3 直接打断播放(监听键盘事件然后打断当前播放并播放下一个)然后复制到对应分类文件夹

    这个思路行得通吗,大家还有更好的工具或者思路吗
    Supplement 1    Jun 23, 2022
    感谢兄弟们的建议,不过分词语言处理 AI 相关的是行不通的(需要联系上下文,且含有外语),退一万步就算行得通,怎么调教,怎么分类写这个规则就很耗时而且不一定完美,我还是得全部听一遍复验(几千个文件),结果还是没效率的
    22 replies    2022-06-25 09:59:54 +08:00
    Soar360
        1
    Soar360  
       Jun 23, 2022
    语言转文字,分词,然后自动归类?
    0x2CA
        2
    0x2CA  
       Jun 23, 2022
    行的通,但是你开发一个花费时间找就分好了,除非你量大,而且后面经常用
    shilianmlxg
        3
    shilianmlxg  
       Jun 23, 2022
    不如用 sony 的 mediago 。记得它的分类是自带。只是解析很慢
    jhjguxin
        4
    jhjguxin  
       Jun 23, 2022
    写个程序主要做下面几件事情
    第一步遍历需要处理的文件列表
    第二步截取每个文件的前 10 秒(如果文件数量并不大,长度也小可以忽略此步骤)
    第三步调用类似科大讯飞语音转写 API 接口( https://www.xfyun.cn/doc/asr/lfasr/API.html
    第四步在提取出的文字中匹配你所需的分类关键字,如果成功进行第五步
    第五部根据匹配到的关键字将对应文件进行分类处理
    第六步将前面第 2-5 步操作失败的文件单独标记进行人工处理即可
    snoopyhai
        5
    snoopyhai  
       Jun 23, 2022
    网上有语音质检的能力. 找找看. 能不能基于质检去做一些特别设定.
    hikarugo
        6
    hikarugo  
    OP
       Jun 23, 2022
    @0x2CA 量大,几千个
    darkengine
        7
    darkengine  
       Jun 23, 2022
    speech to text ,再接个自然语言处理,然后分类
    hikarugo
        8
    hikarugo  
    OP
       Jun 23, 2022
    @Soar360
    @shilianmlxg
    @snoopyhai
    @jhjguxin


    感谢提供建议,不过分词是铁定不行的,有时候还需要联系上下句语义才能处理,而且有的还包含外语,所以只能人工听才能分。
    Buges
        9
    Buges  
       Jun 23, 2022 via Android
    如果隐私能接受,直接买讯飞的转文字(中文)
    tfdetang
        10
    tfdetang  
       Jun 23, 2022
    突然让我想到前段时接很火的那个电视剧 <人生切割术>

    其实我很好奇,人是怎么分类的? 标准是什么? 因为只要听 10 秒 感觉应该也不是特别复杂的上下文理解

    其实用 AI 分类不一定非要转文字啥的,也可以直接拿着音频数据作为一个序列信息来进行分类啊。 也不需要写任何规则只需要先人工分一部分数据就行了。

    只是一共就几千条数据上 AI 显然是不太划算的,得是一个持续性的长期工作才有价值
    Juszoe
        11
    Juszoe  
       Jun 23, 2022
    几千个还是人工处理吧,但 OP 有些小看 AI 了,这种分类是标准的 AI 适用场景,不需要写规则,打上类别标签就好了,难点就在于数据集要自己收集。
    如果要求 100%准确率,可能 AI 确实不合适
    wudicgi
        12
    wudicgi  
       Jun 23, 2022
    如果机器识别不可行的话, 楼主需要的是一个可以在界面上当场进行文件重命名操作的音频播放器?
    yufeng0681
        13
    yufeng0681  
       Jun 23, 2022   2
    原始诉求 还得往前回溯。 目前看是你想要的一个解决方案。
    1 、如果是长期工作,能不能让负责提供素材的人,就按照要求格式提供素材;
    2 、如果是自己采集的素材,也是临时工作,那就看看有没有其他规律可以寻觅,不行的话就只能人工分拣。
    3 、人工分拣,建议用阿里云盘。 它能在线播放音频。
    3.1 你听到 1 类的,你就收藏, 进入收藏库
    3.2 你听到 2 类的,你就下载,再次下载到本地目录 2
    3.3 如果是 3 累的,你不用处理, 等全部处理完毕, 收藏 1 类的下载到本地第二个目录 1
    3.4 你把本地音频和下载的 1 2 类音频 放一起,全部排序,按同名排序,把孤单的 3 类文件,ctrl 选中,然后复制一份到新的目录 3 里, 就成了。
    yufeng0681
        14
    yufeng0681  
       Jun 23, 2022
    注 :阿里云盘的音乐播放界面, 有上一项,下一项, 收藏,下载,分享,按钮。

    重命名和移动按钮在 more 里面,要多点击一下,麻烦。。
    hikarugo
        15
    hikarugo  
    OP
       Jun 23, 2022
    @yufeng0681 谢谢,很有收获。我试了一下云盘下一项的时候并不会自动播放而是顺序播完才播的下一项,而且按空格也不会触发播放,这一点挺难受的,不知可有解决方案。
    libook
        16
    libook  
       Jun 23, 2022
    加个撤销机制以防按错,然后我觉得就可以做个 MVP 方案让负责分类的人员试用一下了,看是否提升了效率,然后根据反馈再优化。
    dddd1919
        17
    dddd1919  
       Jun 23, 2022
    100 块钱,雇个人
    yufeng0681
        18
    yufeng0681  
       Jun 23, 2022
    @fyxtc 感觉是阿里云盘的一个 bug ,或者说体验不合理的地方, 要不给阿里云盘提个问题单,让他修复一下?

    下一项,如果不想动。 那就在播放器那边增加 上一曲,下一曲 的功能,切换快捷键 是 播放器的必须项目。
    XimuTao
        19
    XimuTao  
       Jun 24, 2022
    根据按键分类这个思路, 我写过一个用来分类图片的[photo-classification]( https://github.com/ximu-tao/photo-classification), 需要的话我可以帮你改一个音频版本的
    hikarugo
        20
    hikarugo  
    OP
       Jun 24, 2022
    @XimuTao 看了下,很适合我的需求,我如果你有时间弄的话,那就太感谢了
    XimuTao
        21
    XimuTao  
       Jun 24, 2022   1
    @fyxtc https://github.com/ximu-tao/photo-classification/releases ,下载 audio-classification ,因为一直只有自己在用,所以有些小问题一直没修复,使用的时候注意一下
    hikarugo
        22
    hikarugo  
    OP
       Jun 25, 2022
    @XimuTao 用上了,完美解决,已 star ,感谢
    About     Help     Advertise     Blog     API     FAQ     Solana     6186 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 57ms UTC 06:18 PVG 14:18 LAX 23:18 JFK 02:18
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86