语音输入的4大痛点用语音输入取代打字|百度语音输入法是否解决了中文语音输入的4大痛点?

语音输入的4大痛点
用语音输入取代打字 , 不是未来的趋势 , 而是正在发生的事实 。 不过想要做好中文语音输入法 , 难度是非常高的 , 当下中文语音输入有4大痛点 。
第一 , 因为中文存在大量的同音字 , 不管你吐字多么清晰 , 总会有被误判的可能 , 所以极其考验算法的准确性;
第二 , 大多数语音输入法需要联网 , 才能正常运行 , 断网后识别准确率会大幅下降 , 不如直接打字更为可靠 。
语音输入的4大痛点用语音输入取代打字|百度语音输入法是否解决了中文语音输入的4大痛点?
文章图片
第三 , 平时说话偶尔需要夹杂英文 , 这时候输入法要同时识别中英文 , 容易出现误判 。 而且汉语的语种非常多 , 光是主要方言就高达15种 , 语音输入法很难实现面面俱到 。
第四 , 中文语音输入法的准确率做到95%以上 , 就已经是顶级水准了 , 想要达到100%几乎不可能 , 最后还是需要略微修改一下 , 不可能完全脱离键盘 。
一次很偶然的机会 , 让我开始尝试百度输入法的语音输入功能 。 毕竟百度是全球最大的中文搜索引擎 , 小度更是智能屏行业的领头羊 。 在中文搜索和AI人机交互这两大赛道 , 百度都是行业的领军者 。
语音输入的4大痛点用语音输入取代打字|百度语音输入法是否解决了中文语音输入的4大痛点?
文章图片
因此 , 百度输入法从一开始就被我寄予厚望 。 问题来了 , 最新版本的百度输入法 , 是否解决了语音输入的4大痛点?接下来分享一下我个人的体验 。
正常念稿时的语音准确率
我认为中文语音输入法最关键的就是同音字的纠正 , 以及标点符号的标注 。 我用了两台手机 , 分别用百度和苹果原生输入法 , 两个手机同时测试一段语音进行对比 。 毕竟没有对比 , 是得不出客观结论的 。
百度输入法非常精准的判断了我的意思 , 标题符号也在最适合的地方 , 数字会自动替换成阿拉伯数字 , 基本不用再修改 。
语音输入的4大痛点用语音输入取代打字|百度语音输入法是否解决了中文语音输入的4大痛点?
文章图片
苹果原生输入法出现了3个瑕疵:缺了一个“逗号” , “而”这个字没有识别到 , “80”没有转成阿拉伯数字 , 上下文格式不一致 。 简单对比后 , 可以明显感觉到百度语音输入的使用感受更流畅 。
千万别觉得这点差距无所为 。 总共才60个字左右就有三个瑕疵 。 这意味着你用十几秒输入的文字 , 也需要十几秒去改 , 这显然不能提高码字效率 。 日常聊天用用还好 , 拿来工作肯定不行 。
断网时语音识别的准确率
可能很多人都不知道 , 语音识别技术如果需要较强的性能 , 需要用到的计算量、模型体积是比较大的 , 所以一般会放到云服务器上 。 因此 , 许多输入法的语音功能都要求联网才能使用 , 断网识别则会降低准确率 。
而百度输入法支持离线语音功能 , APP里自带离线语音识别模组 , 就算没有联网也能正常使用 , 同时语音识别的准确率也非常高 , 和它形成明显的对比的是搜狗输入法 。 我用两台手机分别使用百度、搜狗 , 开启飞行模式 , 同时识别同一段语音 , 结果非常有趣 。
语音输入的4大痛点用语音输入取代打字|百度语音输入法是否解决了中文语音输入的4大痛点?
文章图片
客观地说 , 搜狗输入法在联网状态下 , 语音识别率和百度是同一梯队 。 不过在断网之后 , 搜狗输入法的语音识别准确率就会大幅下滑 。 而且不是标点符号的断句出现问题 , 也不是漏字 , 而是直接识别成了别的意思——比如把“拼音”识别为“小艺” , “键盘”识别为“健康” 。
相比之下 , 百度输入法就很稳定 , 离线状态下的准确率 , 和联网状态几乎没有区别 。 成熟的“离线语音”可以带来多方面的好处 , 比如可以适应各种复杂的环境 , 就算断网了也能用 。 对我而言 , “离线语音”让我可以放心地用语音输入 , 去做一些安全性要求较高的编辑工作 。