为什么主流的输入法,都不支持语音输入后,出现候选字让用户自己选择的功能?

看起来,这可能归因于大多数使用语音输入功能的用户不常面临复杂场景,这些用户对输入法在语音输入模式下的语音识别准确率和自动纠正能力的要求比提问者低,这些用户对语音模式操作简便的要求则比较高——候选字会增加操作过程的复杂性、减慢语音识别未出错时的输入速度并让一些用户不满。

讯飞输入法、搜狗输入法等的语音输入功能的核心卖点是“高效”和“免动手”。产品经理在设计该功能的时候默认用户使用语音输入的场景往往是走路、开车、做饭或单纯懒得打字。在这些场景里,用户的眼睛和手往往是被其他工作占用的,或者是在休息,这显然和在语音输入后弹出候选字列表、让用户动手选择或看列表说数字的设计不怎么兼容。

对于题述的“十句话中,经常有半数以上需要我手动调整”的情况,对错别字敏感的用户通常会放弃语音输入、改用键盘打字。刷出这种错误率的时候,提问者是在有噪音的环境输入,还是涉及专业术语、生僻字、多语种混合、方言等情况?

看起来,过去数年间,一些输入法已经考虑了上述情况,为语音输入模式提供了手动划词修正、语音键盘混合输入、行业词库/个性化词库等功能。2026 年,在大语言模型等技术的支持下,语音输入的表现似乎有所改善,一些识别错误的文字可以被大语言模型简单地自动修正。

编辑于 2026-02-24 · 著作权归作者所有