
最近有个语音识别的问题,就是怎么处理断句呢,比如我说了一句话,紧接着说另一句话,我现在的处理是按照固定的时间去识别,比如录了 2 秒之后去识别,这就导致一个问题,这 2 秒内可能有两句话,但另一句可能只说了一半就被录下,导致整个识别之后的句子就不通顺,所以请教各位大佬,这里应该怎么处理,才能让语句识别的更精确一点
1 xuelang 2024 年 1 月 18 日 试试 azure 的 speech_to_text ? |
2 pipixiarwksb OP @xuelang 这个我来试下 |
3 raycool 2024 年 1 月 18 日 |
4 pipixiarwksb OP @raycool 好的 哥 我试下 |