对话腾讯李学朝：解读从“数字人”到“数智人”的进化论( 三 ) 智东西作者|ZeR0编辑|漠影智东

第二个是在家居和车载等真实场景下，除了需要克服环境噪声、人声干扰等问题外，还需要应对识别任务复杂度高、用户口音多变、低资源设备上识别性能的提升等种种挑战。
在后端处理环节，腾讯语音智能研发了“语音-语义结合的多领域在线识别系统”、“全双工交互及闲聊拒识”、“端到端高性能离线识别系统”等技术方案，运用深度学习建模、前后端联合优化、语音-语义联合优化等技术手段，很好地满足了不同应用场景下，对于语音交互在识别率、鲁棒性、资源消耗和用户体验等多方面的要求。
第三个在TTS（从文本到语音）方面，以前是单纯一个声音，现在加上肢体或脸部表情，以及语言的情绪表达，对信息理解更加多元和准确。
第四个是文本驱动，输入一些文本、情绪相关的内容，能让数智人的面部表情根据上下文和各种情况做不同的表现。
综合这几个大的融合趋势后，语音将能被更清晰地输入、更形象地理解和更准确地表达出来。
结语：腾讯云智能战略的重要组成部分
此次大会期间，腾讯首次公布了云智能战略架构，而腾讯云小微数智人是腾讯云智能战略的重要组成部分，坚持“服务于人”的价值理念，来为用户提供更有温度的服务、更自然的交互体验。
腾讯云智能战略架构面向管理者、生产者、开发者、用户四类人群，提供决策、协作、创新、服务四大核心能力，同时依托人工智能、大数据、云计算和物联网的云智能架构，贴合客户产业场景需求，输出面向各行业的智能综合解决方案。
李学朝提到：“数智人正在走进我们的生活，在企业中承担岗位职责，为用户创造前所未有交互智能体验同时，提升企业服务效率和品牌形象。 ”
【对话腾讯李学朝：解读从“数字人”到“数智人”的进化论】当前，腾讯云小微新一代数智人已经在金融、传媒、文旅、出行等多各业务场景领域发挥价值。我们期待看到未来数智人技术与文字、听觉、视觉、触觉、肢体动作等多维度感知实现更好的融合，为用户带来更高质量的信息交互以及建立更深的情感链接。