交互|语音交互规范
编辑导语:随着互联网的发展,语言交互融入了我们的日常生活中。那么,关于语音交互规范,你又了解多少呢?本文从AI语音交互发展谈起,总结了一些语音交互规范内容,供大家参考,希望对你有所帮助。
文章插图
一、AI语音交互发展语音交互的发展经历了三个阶段:
第一阶段是上世纪80年代,语音交互能够实现一问一答,前后回答并不具有内容的相关性。随着人工智能和深度学习的发展,机器的理解能力越来越强。
自从2009年开始,随着iPhone手机siri的出现,进入第二阶段,语音的对话能做到有问有答,能够理解上下文,但是这种应用场景还比较局限。
第三阶段,2014年Amazon Echo的出现,实现了应用领域的革新,拓展了语音交互的场景,智能语音交互的爆发则在2017年智能音响的发展,语音交互得到巨大的突破,语音和语意的理解更加准确,具有代表性的产品有小爱音响、天猫精灵和小度音响等。
二、什么是AI语音交互?AI语音交互通俗的理解就是:人与机器的对话。语音交互在技术方面讲主要包括:听(ASR)、语义理解(NLP)、说(TTS)。
听(ASR):用ASR技术把语音识别成文字。
语义理解(NLP):使用NLP技术,把文字输入转化为文字输出。通过语法判断、上下文理解、关系理解、知识图谱等技术。就是理解文字的含义后,把想反馈的回答以文字表达出来。
说(TTS):使用TTS技术把文字合成为语音。
三、为什么要建立AI语音交互规范?在公司角度:有统一的交互规范便于公司内部产品形成统一的共识,减少沟通的成本,提升工作的效率。
在设计师角度:对外有了统一的交互规范便于与产品、开发等人员的沟通,对内便于组织内的成员学习与提高。
在设计管理者的角度:对内能达成设计共识,对外提升设计组织的影响力。
在我看来交互规范是一个内部产品,它随着产品的生命周期迭代演进;交互规范是一套内部共识,它不仅仅解决了设计问题,更是组织协同的解药;交互规范是一种思维方式,不仅产品设计,甚至自己的生活都可以借鉴设计系统来提升效率。
四、AI语音交互规范主要内容是什么?
- 语音交互原则
- 语音交互框架
- 语音逻辑规范
- 语音控制原则
- 多模态交互
- 弹框机制
- 操作反馈
- 界面架构
- 情感化设计
合适的速度。语音的播报速度、结果呈现速度、IP形象展示的速度、文字展示及纠错的速度都在一个合适的范围内。
易取原则。尽量减少用户对操作目标的记忆负荷,交互动作和结果都是可见、可听的。
人性化帮助原则。在用户需要帮助的时候提供必要的帮助说明和引导。
灵活高效原则。语音交互可以跨越层级,直接高效的触达目标。
防错原则。在用户意图不明确的时候,可以向用户询问,还可以预测用户的可能的意图提示用户。
消除歧义。交互的形式和内容不会让用户感到困惑,当用户的命令存在歧义时,通过交互的形式消除歧义,帮助用户达成目标。
适应当地文化。语音的形象IP和话术的提问及回答都要符合用户所处的文化背景和地域文化。
2. 交互的可用性要素轮流对话。在对话中基于信号的传递, 进行轮流的表达。回答的机制是一问一答。
上下文串联。在对话的语言中需要结合上下文的语意串联起来进行回答,这样有助于提升对话的准确性。
- 显示器|微信新功能开始!长语音可以暂停
- 微信上线“语音暂停”功能
- 微信聊天最令人头疼的场景是什么?一定有人会说是对方发来一连串语音还都是超过30秒的长消息...|终于!微信上线万众期待的新功能!网友:总算等到了
- 全文共559字|“史诗级”更新!微信听长语音能暂停了,网友:这些功能也赶紧!
- 60秒长语音不用再从头听了!微信迎来“史诗级更新”
- 微信聊天最令人头疼的场景是什么?一定有人会说是对方发来一连串语音还都是超过30秒的长消息...|微信、支付宝,上线新功能
- 微信聊天最令人头疼的场景是什么?一定有人会说是对方发来一连串语音还都是超过30秒的长消息...|终于!微信新增语音暂停功能,60秒长语音不用重头再
- 喜大奔普!微信语音暂停播放功能来了
- 中文|爱数智慧CEO张晴晴:基于”情感“的人机交互,要从底层数据开始
- 终于!微信这个新功能上线,60秒长语音不用从头再听了