
百度提供免费的语音接口,想做个实时语音转写文字的 app,特此发帖求推荐哪些源码项目比较合适?
想借鉴某些源码思路,写个字幕式的,效果和小米闻声 app 差不多吧
可以求讯飞听见,小米闻声 app 类似的源码?
我不知道小米闻声怎么做到实时转写文字的,我能想到的无非分割音频文件,每个音频 1s,转成 PCM 格式进行上传,等收到数据包提取转换后的文字再输出,但一句话说完,这句话的音频文件转换后的文字没法看。。。
1 ch2 May 12, 2021 语音识别你分割了就丧失了前后文语境,肯定识别不出来的 你想要实时的那就是本机实时预测,具体怎么做是人家的商业秘密,不可能让你白嫖的 |
3 ALLROBOT OP 免费不行,就上付费的 |
4 cutemurphy2888 May 12, 2021 腾讯的同声传译 |
5 gainsurier May 12, 2021 苹果本地有 api 可以直接调用 |
6 agoodob May 12, 2021 实时? websocket 呗。 如果不用实时的,而且手头有 .mp3 .aac 等音视频文件希望拖到一个程序里直接转文字,看一下: https://github.com/1c7/Translate-Subtitle-File |
7 inhzus May 12, 2021 via iPhone 直接用现成的实时语音转文字,已经非常成熟了,别折腾自己。阿里云、腾讯等等都有,市场价 1-2 元每小时 |
8 ethanlu May 12, 2021 |
10 ALLROBOT OP @gainsurier 苹果没试过,可以去试试 |
11 ALLROBOT OP @gainsurier 你这么一说,我想起了微软好像也有,我去瞧瞧 |
13 ALLROBOT OP @inhzus https://ai.baidu.com/ai-doc/SPEECH/qk76b444d 已经在看百度语音的 sdk 手册了 @agoodob 了解 websocket 了,语音识别我没怎么接触,第一次接触这方面的。。。抱歉哈,在看 sdk 手册了,如楼上所言,根据 sdk 进行开发吧 |
14 muhuan Jan 30, 2022 楼主最后选择的哪个?我也有一些 1h 左右的语音,想转化为文本 |