给我的 ChatGPT 加了语音功能,貌似效果还行 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
nonfu
V2EX    OpenAI

给我的 ChatGPT 加了语音功能,貌似效果还行

  •  1
     
  •   nonfu 2023-03-10 09:58:43 +08:00 5216 次点击
    这是一个创建于 947 天前的主题,其中的信息可能已经有所发展或是发生改变。

    昨天给我的克隆版 ChatGPT - GeekChat 加了语音支持(语音识别由 OpenAI Whisper 模型驱动):

    貌似效果还行,感兴趣的可以试试:GeekChat - 免费体验版 ChatGPT

    另外,大家有什么好的靠谱的中文语音 API 欢迎给我推荐,之前没怎么接触过这块。

    第 1 条附言    2023-03-10 15:03:15 +08:00
    大家测试下就好 能少用少用哈 手下留情 这个 API 费用估计这个月得好几百美金。。。
    第 2 条附言    2023-03-13 10:41:20 +08:00

    周末把前端 UI 重构了一下:

    30 条回复    2023-03-13 09:27:55 +08:00
    xujinkai
        1
    xujinkai  
       2023-03-10 10:11:41 +08:00 via Android
    离涩涩聊天机器人又近了一步
    tianyou666shen
        2
    tianyou666shen  
       2023-03-10 10:29:11 +08:00
    拿来练习英语是不是也蛮好用的
    nonfu
        3
    nonfu  
    OP
       2023-03-10 10:41:47 +08:00
    @tianyou666shen 嗯 是的
    laixy9527
        4
    laixy9527  
       2023-03-10 11:10:37 +08:00
    题主是用的哪款语音软件或接口?方便透露么
    vsitebon
        5
    vsitebon  
       2023-03-10 11:14:00 +08:00
    @laixy9527 #4 题主的帖子里面说了,用的 OpenAi Whisper
    Metre
        6
    Metre  
       2023-03-10 11:20:49 +08:00   1
    结果也搞成语音~
    redditer
        7
    redditer  
       2023-03-10 11:35:53 +08:00
    考虑开源吗?
    AoEiuV020CN
        8
    AoEiuV020CN  
       2023-03-10 12:06:52 +08:00
    现在看 chatGPT 的回复都会脑补出老高小茉的声音,感觉他们小茉念 chatGPT 的回复声音非常合适,
    shuxiaokai
        9
    shuxiaokai  
       2023-03-10 13:53:33 +08:00 via Android
    lambdaq
        10
    lambdaq  
       2023-03-10 14:22:12 +08:00
    真好。没有叫 geeker
    Depth
        11
    Depth  
       2023-03-10 14:44:50 +08:00
    我已经看到基于 ChatGPT 的英语口语对话练习程序了。很好,很强大!
    nonfu
        12
    nonfu  
    OP
       2023-03-10 14:55:10 +08:00
    @laixy9527 我用的 OpenAI 接口啊 speech to text 基于最近发布的 Whisper 模型
    nonfu
        13
    nonfu  
    OP
       2023-03-10 14:56:44 +08:00
    @Metre 可以的啊 把文本生成语音就好了 这种 AI 软件也挺多的 不过成本就上去了 个人扛不住。。。OpenAI 都用不起 我看已经超免费限额了
    nonfu
        14
    nonfu  
    OP
      &bsp;2023-03-10 14:57:45 +08:00
    @redditer 已经开源 在 Github 上 你可以关注我的博客: https://geekr.dev ,这两天会把开发过程更新进去 之前写了一篇没有语音的
    nonfu
        15
    nonfu  
    OP
       2023-03-10 14:58:48 +08:00
    @AoEiuV020CN 哈哈 同好
    nonfu
        16
    nonfu  
    OP
       2023-03-10 15:00:51 +08:00
    @lambdaq kr 多有感觉 氪星人 化学元素 还有这不能少写一个字母嘛
    nonfu
        17
    nonfu  
    OP
       2023-03-10 15:01:54 +08:00
    @Depth 理论上没啥问题 个人扛不住这个成本 做个玩具可以 公司就随意了
    runliuv
        18
    runliuv  
       2023-03-10 15:16:30 +08:00
    和小爱同学差不多了。
    cuicuiv5
        19
    cuicuiv5  
       2023-03-10 15:22:12 +08:00   1
    我正准备做一个类似的语音助手, 搭配微软 Azure 的 TTS, 效果一定很棒
    微软的 api 似乎可以流式传输, 这样可以让他逐字读出来, 体验更好, 不会卡顿
    icatme
        20
    icatme  
       2023-03-10 15:22:29 +08:00
    我想用 ESP32 开发板做一个聊天玩具, 语音->文字->GPT API->TTS 输出
    nonfu
        21
    nonfu  
    OP
       2023-03-10 15:37:37 +08:00
    @runliuv 小爱同学这种没啥技术含量 API 应该都是调用别人的 自己买个树莓派是不是也能做
    nonfu
        22
    nonfu  
    OP
       2023-03-10 15:38:18 +08:00
    @cuicuiv5 嗯 我也试试
    nonfu
        23
    nonfu  
    OP
       2023-03-10 15:38:46 +08:00
    @icatme 没毛病 我最近也想倒腾个硬件玩玩
    aogg
        24
    aogg  
       2023-03-10 15:52:16 +08:00
    输入框要支持 shift + enter 功能进行换行
    nonfu
        25
    nonfu  
    OP
       2023-03-10 16:41:20 +08:00
    @aogg 嗯 后面可以优化 这个只是体验版 不是 ChatGPT 的替代品 也不打算这么做 所以不会做的很重
    sniperhgy
        26
    sniperhgy  
       2023-03-10 17:51:15 +08:00
    感觉和 Chatgpt 有相同的特性:张嘴就来



    盟军敢死队一共有几代


    GeekChat
    盟军敢死队游戏共有三代。



    盟军敢死队一共有几代,每一代叫什么


    GeekChat
    盟军敢死队游戏共有三代,每一代分别叫做:

    Command & Conquer: Red Alert - Allied Disc
    Command & Conquer: Red Alert 2 - Allied Campaign
    Command & Conquer: Red Alert 3 - Allied Campaign


    commandos behind enemy line 在中国叫什么


    GeekChat
    《无声敌线》( Wú Shēng Dí Xiàn )是 Commandos: Behind Enemy Lines 在中国的官方翻译名称。
    nonfu
        27
    nonfu  
    OP
       2023-03-10 20:23:10 +08:00
    @sniperhgy 就是调用 chatgpt api 接口 能不一样吗
    poyanhu
        28
    poyanhu  
       2023-03-10 21:55:35 +08:00
    要是答案也是读出来的语音。那可以拿来学习外语了。
    nonfu
        29
    nonfu  
    OP
       2023-03-11 00:06:06 +08:00
    @poyanhu 目前 OpenAI 没有提供相关接口 不过其他厂商有这种 API 的
    busuzhike
        30
    busuzhike  
       2023-03-13 09:27:55 +08:00
    赞,相当好,问了好几个问题,拜票了,谢谢
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5508 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 37ms UTC 01:28 PVG 09:28 LAX 18:28 JFK 21:28
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86