rt 请问安卓是否有自带包可以实现?目前最好用的一般是走什么方案?谢谢~

rt 请问安卓是否有自带包可以实现?目前最好用的一般是走什么方案?谢谢~
1 dayeye2006199 Dec 15, 2024 via Android 不需要本地就随便找个 API |
2 Yiverin OP @dayeye2006199 您一般推荐什么 api 呀?而且我的需求不是实时的。比如 1 小时的录音转文本 |
3 unclemcz Dec 15, 2024 via Android 长音频转录当前好像还没看到有纯客户端方案。 |
5 unclemcz Dec 15, 2024 via Android @Yiverin 性能跟不上吧,举个例子,我用 4070laptop ,转录一个小时的音频,差不多 5 分钟左右,这还是用 whisper turbo 模型的情况下。同样模型,手机端估计没办法。 |
6 unclemcz Dec 15, 2024 via Android 实时转录也就几十秒,体验会好很多。 |
7 felixlong Dec 15, 2024 有支持 Android 的客户端方案,而且是 Whisper: https://github.com/ggerganov/whisper.cpp |
11 hahiru Dec 15, 2024 语音转文字用飞书就挺好。客户端效果非常不错。 |
13 magicZ Dec 16, 2024 当然是新一代的 kaldi ,文档详细功能强大, https://github.com/k2-fsa/sherpa-onnx |
14 ykrank Dec 16, 2024 借楼问一下,有没有本地图像识别的 SDK ?最好免费的模型 |
15 ykrank Dec 16, 2024 识别图片里的文字 |
17 luaex Dec 16, 2024 ASR 建议用 sherpa |
18 luaex Dec 16, 2024 @ykrank cnocr 里面的那些 onnx 的模型也许能试一下 https://github.com/SvenVincent/cnocr |
19 XXWHCA Dec 16, 2024 |