|OPPO的航船:小布生命体将驶向怎样的科技彼岸?( 二 )


智慧是一种抽象的、虚无缥缈的东西 , 机器要展现出类人般的智能 , 理论上要从三个角度完成进化:一是记忆 , 人类能够把很多长期状态的信息编入大脑的算法内 , 在未来某一天来调用它 , 而稳定的长期记忆是机器智能的一大挑战 , 表现在智能助手上 , 就是难以在多轮对话中流畅而自然地交流;二是计算 , 人脑的并行计算能力非常强大 , 擅长解决复杂的任务 , 如分析、决策 。 在算法和算力的快速发展下 , AI也开始在决策智能上展现出类人的能力 , 让智能助手得以从“命令式被动响应”进化为“贴心式主动服务”;三是学习 , IBM的深蓝计算机在1997年战胜国际象棋冠军加里·卡斯帕罗夫时 , 最大的优势是记忆能力和计算能力 , 到了2016年AlphaGo击败李世石 , 深度学习让机器实力有了实质性的飞跃 。 拥有学习能力之后 , 智能助手能够自我进化与迭代 , 解决互动程式化、类人感低的问题 。
具体到小布助手4.0版本中 , 我们已经可以看到在记忆、计算、学习这三个层面 , 小布正在带来真实可感的体验变革 。

记忆方面 , 适当的记忆决定了智能助手的交互体验是否自然顺畅 。 对于人类来说 , 根据之前的信息来作出即时反应 , 几乎是一种本能 , 根本不需要特别调动记忆模块 , 但这么简单的事对于AI智能体来说却是很困难的 。 在长短期记忆神经网络(LSTM)出现之前 , 传统神经网络没有记忆功能 , 无法处理较长序列数据 , 简单来说就是记不住长距离数据的信息 , 表现在智能助手身上 , 用户跟它说完“吃完晚饭跟我聊会儿天” , 它还会问一句“吃了没” , 妥妥地煞风景 。 要避免用户说“前门楼子”AI说“胯骨轴子”这种前言不搭后语的情况 , 就需要智能助手很好地理解上下文 , 以此来生成更自然、情感化的表达 , 这就离不开强大的记忆能力 。 所以 , 研究人员特别为小布研发了记忆能力 , 让AI在聊天过程中能够理解一些更长距离的关键数据 , 不至于学过就忘 , 从而生成有趣、有用的聊天内容 , 用户不必反复强调一些说过的内容 , 人机交流也就更加轻松愉快 。 有了记忆 , 智能助手才有了可持续成长的人格化基础 。

计算方面 , 在端侧算力的支持下 , 小布助手得以搭载更强大的算法应用 , 基于自研的情感识别算法 , 让小布助手具备智趣单轮、技能引导、话题多轮、情绪感知等基础能力 , 再引入较为前沿的预训练技术 , 通过1亿~10亿参数级别的大模型来提升语言理解的泛化能力 , 缓解因“意图理解不到位”而造成的“智障”问题 。 同时 , 注重AI与知识计算的结合 , 构建了精品知识图谱 , 规模达到亿级别的实体和百亿级别的关系 , 让小布具备足够的知识储备 , 能够解答用户各种各样的疑问 , 在知识问答方面带来了2%~4%的效果提升 。 一番技术打磨之下 , 小布助手对于口语化表达的理解、用户意图的分析、有温度的情感化交互 , 就得到了有效的提升 。
不止于此 , 小布助手还能够准确判断用户需求、结合上下文场景 , 进而主动提供服务 。 将数字服务的各个“断点”串联起来 , 让服务呈现连贯性 , 用户感受到的是符合行为惯性的丝滑与顺畅 , 比如感知到用户的出行需求后 , 小布会在用户出行前就提供行李准备、酒店预订、交通情况、防疫政策等基础提醒 , 提前为旅程做好充分的准备 。

学习方面 , 小布更智慧的一面还体现在持续学习和发展进化的能力上 。 对内 , 小布会根据用户的行为反馈不断学习进化 , 变得越来越“懂你”:如果发现用户的需求没有被满足 , 会反复修改自己的话术进行重试;收到用户的表扬 , 也会根据口碑满意度体系来进一步优化 , 持续提升自己 。 对外 , 小布会持续学习多场景、跨终端带来的数据资源 , 不断扩展自身的能力边界和服务场景 。 比如通过场景理解 , 支持一句话多指令 , 让查天气、定闹钟、打电话等常规服务更加便捷高效 , 只需对小布说一句“打开健康码”指令 , 能省去手动操作的一系列繁琐流程 。 另外 , 小布可以支持手机、手表、电视、Pad等OPPO自有设备控制 , 以及小布生态的第三方品牌 , 跨端、跨设备执行指令 , 打破了数据壁垒 , 既让用户享受到全场景服务无缝切换的丝滑;又能够通过多终端数据协同反哺算法 , 为小布助手的自主学习提供多维度的数据养分 , 进一步提升小布的智慧水平和服务能力 。