市面上的语音输入法,比如某 GLM ,真的是贵且不好用。
索性手搓一个,用最好的 ASR ,接 sota LLM !
用的阿里云百炼 FunASR 中文英文准确率都很高,响应速度刷刷的,很爽;
接的 Openrouter ,如果开启 AI 能力可以自己定义技能,在你语音输入后自动对输入内容进行改写;
这东西需要你自己去申请 key ,申请两个 key 一百块感觉够用一年了
LLM 对语义的理解强的很,不怕你说的多,就怕你给的信息不全,所以我现在 用 Codex 或者 Claudecode 已经离不开语音输入了,如果你也是 vibecoding 场景,那必须要试试。
如果你是写小说的作者也可以尝试,AI 润色这时候就有用了,把小说基本信息作为指令的一部分,然后让 AI 帮你转写,是可以直接成稿的。
page 这里有更详细的介绍
https://tianyu19920816.github.io/VoiceInputApp/
索性手搓一个,用最好的 ASR ,接 sota LLM !
用的阿里云百炼 FunASR 中文英文准确率都很高,响应速度刷刷的,很爽;
接的 Openrouter ,如果开启 AI 能力可以自己定义技能,在你语音输入后自动对输入内容进行改写;
这东西需要你自己去申请 key ,申请两个 key 一百块感觉够用一年了
LLM 对语义的理解强的很,不怕你说的多,就怕你给的信息不全,所以我现在 用 Codex 或者 Claudecode 已经离不开语音输入了,如果你也是 vibecoding 场景,那必须要试试。
如果你是写小说的作者也可以尝试,AI 润色这时候就有用了,把小说基本信息作为指令的一部分,然后让 AI 帮你转写,是可以直接成稿的。
page 这里有更详细的介绍
https://tianyu19920816.github.io/VoiceInputApp/

