交互|语音交互规范( 二 )


多样性。对于具体的场景,应该多样的问与答,结合情景多样性的回答。
理解行为。在对话的过程中尽可能的真诚、详实和有效的理解对话的内容。
反馈。对于用户的请求应给予反馈,无论是声音、文字还是图像。
语音的效率。在对话的过程中往往有一些隐晦的潜台词,在对话的过程中要理解口语之下的更深层次的意图,并给予准确的回答。
3. 人性化的表达语言是人类表达情感的重要方式,在语音交互的过程中,人性化的设计必不可少的。状态可见原则。在整个语音交互的对话过程中,对于场景、角色都需要从人与人对话的角度出发。
对话的逻辑。语言对话逻辑应该遵循人类语言的本能,不应该强迫用户为了适应机器对话而采用层级递进的逻辑思维,用户只需要正常的表达就可以。
情感化。语音交互需要人格化、情感化。需要与产品的品牌调性相契合。语音人格方向特征具有:有趣、正能量、机智和温暖等特点。
口语。口语化的交流,同时也需要避免说显而易见的内容,对话需要多样性,使体验更加自然。
环境贴切。使用简单易懂和约定俗成的表达,尽可能的贴近用户所在的环境。
地方语言。语言的本身要有地域的特色,语音的表达要有广泛的群众基础,其中方言识别也是语音交互中重要的技能。
六、语音交互框架1. 语音交互流程一次完整的语音交互流程,包括:唤醒—ASR—NLP—Skill—TTS语音应答/界面结果展示(如下图所示)。
交互|语音交互规范
文章插图
2. 语音交互框架1)根据苹果公司的全品类设备的特点,在语音框架需保持一致,兼顾mac、paid、手机大小屏和横竖屏。Siri交互包括:Siri的状态、ASR内容/话术、语言TTS反馈。
交互|语音交互规范
文章插图
3. 远场与近场远场应用比如Siri。直接说:“Siri”唤醒语音助手,唤醒后可以远程进行语音交互。
近场应用比如智能电视。使用遥控器,按住语音键,对着遥控器进行语音近距离语音交互。
设计用例:
User:“Siri,定个闹钟”。
语音助手:“你要定什么时候呢?”
User:“明天早上8点”。
4. 正常/异常状态正常状态:
语音交互的过程中,通过TTS和Siri状态(包括:等待与加载),来满足及时反馈。
异常状态:
语音交互过程中,判断外网终端->提示:待命+网络异常,请检查网络。
注:无界面时,直接TTS反馈:【网络异常,请检查网络】(要求TTS写在本地)。
5. 对话澄清指语音主动与用户的对话,达到意图的确认。
说明 :
① 澄清应用于用户意图不清晰,必须进行再次对话才能进行意图确定,否则导致机器执行的任务错误。
② 假如在远程的交互中,澄清的过程中,需要语音一直处于待命状态(也就是无需再次唤起即可对话)。
③ 在澄清的过程中,需要关键词引导,以便于用户表达明确的意图。
④ 为了让用户能自然的回复和应答,同时也防止自然口语化,语音的澄清话术需要采取封闭式关键词引导。
⑤ 关键词的引导,根据人的记忆及听力的规则,每次小于等于3个,且近俩个每句话术文字在7±2之间。
设计用例:
User:“帮我定下明天闹钟?”(意图不明)
语音助手:“你要定几点闹钟?”(几点钟为关键词)
Uesr:“明天早上8:00”(意图明确)
6. 多伦对话多轮对话指语音助手与用户进行一轮(一问一答)以上的对话。
说明:
① 应用于意图虽然清楚、可执行,但任务执行结果不清晰。如:结果的集合过大,用户没有找到具体的内容。