
rt 请问安卓是否有自带包可以实现?目前最好用的一般是走什么方案?谢谢~
1 dayeye2006199 350 天前 via Android 不需要本地就随便找个 API |
2 Yiverin OP @dayeye2006199 您一般推荐什么 api 呀?而且我的需求不是实时的。比如 1 小时的录音转文本 |
3 unclemcz 350 天前 via Android 长音频转录当前好像还没看到有纯客户端方案。 |
5 unclemcz 350 天前 via Android @Yiverin 性能跟不上吧,举个例子,我用 4070laptop ,转录一个小时的音频,差不多 5 分钟左右,这还是用 whisper turbo 模型的情况下。同样模型,手机端估计没办法。 |
6 unclemcz 350 天前 via Android 实时转录也就几十秒,体验会好很多。 |
7 felixlong 350 天前 有支持 Android 的客户端方案,而且是 Whisper: https://github.com/ggerganov/whisper.cpp |
11 hahiru 350 天前 语音转文字用飞书就挺好。客户端效果非常不错。 |
13 magicZ 349 天前 当然是新一代的 kaldi ,文档详细功能强大, https://github.com/k2-fsa/sherpa-onnx |
14 ykrank 349 天前 借楼问一下,有没有本地图像识别的 SDK ?最好免费的模型 |
15 ykrank 349 天前 识别图片里的文字 |
17 luaex 349 天前 ASR 建议用 sherpa |
18 luaex 349 天前 @ykrank cnocr 里面的那些 onnx 的模型也许能试一下 https://github.com/SvenVincent/cnocr |
19 XXWHCA 349 天前 |