对话腾讯李学朝:解读从“数字人”到“数智人”的进化论( 三 )


第二个是在家居和车载等真实场景下 , 除了需要克服环境噪声、人声干扰等问题外 , 还需要应对识别任务复杂度高、用户口音多变、低资源设备上识别性能的提升等种种挑战 。
在后端处理环节 , 腾讯语音智能研发了“语音-语义结合的多领域在线识别系统”、“全双工交互及闲聊拒识”、“端到端高性能离线识别系统”等技术方案 , 运用深度学习建模、前后端联合优化、语音-语义联合优化等技术手段 , 很好地满足了不同应用场景下 , 对于语音交互在识别率、鲁棒性、资源消耗和用户体验等多方面的要求 。
第三个在TTS(从文本到语音)方面 , 以前是单纯一个声音 , 现在加上肢体或脸部表情 , 以及语言的情绪表达 , 对信息理解更加多元和准确 。
第四个是文本驱动 , 输入一些文本、情绪相关的内容 , 能让数智人的面部表情根据上下文和各种情况做不同的表现 。
综合这几个大的融合趋势后 , 语音将能被更清晰地输入、更形象地理解和更准确地表达出来 。
结语:腾讯云智能战略的重要组成部分
此次大会期间 , 腾讯首次公布了云智能战略架构 , 而腾讯云小微数智人是腾讯云智能战略的重要组成部分 , 坚持“服务于人”的价值理念 , 来为用户提供更有温度的服务、更自然的交互体验 。
腾讯云智能战略架构面向管理者、生产者、开发者、用户四类人群 , 提供决策、协作、创新、服务四大核心能力 , 同时依托人工智能、大数据、云计算和物联网的云智能架构 , 贴合客户产业场景需求 , 输出面向各行业的智能综合解决方案 。
李学朝提到:“数智人正在走进我们的生活 , 在企业中承担岗位职责 , 为用户创造前所未有交互智能体验同时 , 提升企业服务效率和品牌形象 。 ”
对话腾讯李学朝:解读从“数字人”到“数智人”的进化论】当前 , 腾讯云小微新一代数智人已经在金融、传媒、文旅、出行等多各业务场景领域发挥价值 。 我们期待看到未来数智人技术与文字、听觉、视觉、触觉、肢体动作等多维度感知实现更好的融合 , 为用户带来更高质量的信息交互以及建立更深的情感链接 。