关于手机/车机侧开发语音助手,本地部署 AI 小模型 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
maokg
V2EX    程序员

关于手机/车机侧开发语音助手,本地部署 AI 小模型

  •  
  •   maokg 15 天前 1853 次点击
    我想做一个语音助手,现在有两种场景,联网和断网。断网下我想部署一个端侧的小模型处理我的指令,不知道现在有哪些开源模型可以使用?
    18 条回复    2025-09-26 17:00:24 +08:00
    coefu
        1
    coefu  
       15 天前
    想一想就行了,目前你这个想法整个业界也没有什么 80 分的方案。
    Solix
        2
    Solix  
       15 天前
    ???别闹了,7b 全精度显存需求:大约 28~32 G ,量化 8/16G 能运行,然后跑起来有啥用,它能搞指令遵循还是结构化?
    maokg
        3
    maokg  
    OP
       15 天前
    @Solix 不用很复杂,断网环境下能识别到播放音乐、打开车窗这类简单指令就可以,但准确度可能要高一点
    play78
        4
    play78  
       15 天前
    如果只是固定单词指令,现在 AIOT 芯片和方案就有现成的。便宜的几毛钱的芯片就内置了。淘宝搜索“LED 语音灯”,准确率比大模型准非常多。
    maokg
        5
    maokg  
    OP
       15 天前
    @play78 感谢,我了解一下
    jacketma
        6
    jacketma  
       15 天前
    自己部署这个就可以 huggingface.co/Qwen/Qwen2.5-Omni-7B
    bigtear
        7
    bigtear  
       15 天前
    小米的智驾用的是一个 128g 显存的 NVIDIA 开发版,你可以试试能不能调用它
    otakustay
        8
    otakustay  
       15 天前
    @Solix 车机有限场景下的指令遵循,Siri 的水平就够了,Siri 这方面可是纯端的,哪需要 7B 这么大规模
    ca2oh4
        9
    ca2oh4  
       15 天前
    固定指令的话,乐鑫都有成熟的方案可直接用了
    imliuruiqi
        10
    imliuruiqi  
       15 天前
    非要本地的话也有一些量化后的小模型,但效果可能需要你自己实验一下 相关研究可以顺着 huggingface 的 smollm 去找: https://huggingface.co/blog/smollm
    Tink
        11
    Tink  
    PRO
       15 天前
    @maokg #3 单纯指令的话,看一下机芯智能的离线语音模块 su03t ,还有天问的 asr 系列,都可以满足。我在家里的智能家居控制用的都是这些
    skallz
        12
    skallz  
       15 天前
    我觉得你这个方案就想错了,应该是做一个语音识别,然后根据关键词,去做对应的操作,而不是接入 llm 大模型。。。
    me15000
        13
    me15000  
       15 天前
    @coefu 到处都能看到这个喷子,你到底懂不懂啊,不懂别瞎逼逼行不行
    humminwang
        14
    humminwang  
       15 天前
    gemma 3 270m 可以试试 500 多 MB 内存即可
    wheat0r
        15
    wheat0r  
       15 天前
    我理解这个 OP 的这个逻辑,人是很复杂的,很多时候用户并不会给出指定的指令,确实需要端侧具有一定的思考能力。
    比如用户可能并不会说“播放歌曲千万次的问”,而是说“给老子整个刘欢那个 ask 啥的歌”
    op351
        16
    op351  
       14 天前
    @wheat0r 我想了想 离网做了这个也没啥用 因为音乐软件还是要联网搜索,然后播放 哈哈
    maokg
        17
    maokg  
    OP
       14 天前
    @wheat0r 对,bro ,你懂我。没联网其实有 USB 音乐 @op351 哈哈哈哈哈,我最需要的想法就是精确解析出用户的意图。
    maokg
        18
    maokg  
    OP
       14 天前
    @jacketma @ca2oh4 @imliuruiqi @Tink @humminwang 感谢,我去了解一下
    关于     帮助文档     自助推广系统     博客     a href="/help/api" class="dark" target="_self">API     FAQ     Solana     2960 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 12:13 PVG 20:13 LAX 05:13 JFK 08:13
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86