虚拟数字人的变迁:从小众走向共生( 三 )


Siren的所有动作表情都由实时捕捉以及实时渲染形成 。 操作者需要将一套特制的设备戴在头上 , 这一设备会实时跟踪200多个面部特征点 , 再把这些特征点实时反映到系统构造的3D脸部模型上 , 最终呈现为以每秒60帧输出的动作表情 。 整个捕捉过程会在15毫秒内完成 , 基本不会有什么延迟 。
虚拟数字人的变迁:从小众走向共生
文章图片
图:虚拟数字人Siren
2021年6月 , 由新华社、腾讯联合打造的全球首位数字航天员、数字采访人员“小诤”出现 。 小诤在不到3个月的时间被打造出来 , 相较Siren的制作周期缩短了一半 。 这依赖于一套高效人脸制作管线xFaceBuilder , 通过将建模、绑定、动画等环节纳入平台并统一解法 , 大大缩短了制作的流程 。
当然 , 从成本上来讲 , 虚拟数字人的成本支出非常大 。 例如团队在“小诤”脸上种了10万根面部汗毛 , 这对机能的消耗是极其庞大 。 高昂的建设成本使得虚拟数字人难以在商业领域大规模落地 。
虚拟数字人的变迁:从小众走向共生
文章图片
图:虚拟数字人“小诤”
三、AI技术的引用带来大规模商业化应用
随着虚拟数字人技术的发展 , AI技术成为制作和驱动虚拟人重要的工具 。 AI技术的支持下 , 数字人制作过程得以简化 , 深度学习算法突破 , 提升虚拟人语音表达、语义理解以及对话等能力 。
在《2022年中国虚拟人产业发展白皮书》中 , 数字虚拟人被分为下述两种:
广义虚拟人(Metahuman) , 指通过CG建模、手绘方式完成虚拟人前期制作 , 通过联合动捕、面捕技术实现驱动的虚拟人 。
超级自然虚拟人(Albeing) , 指主要通过A技术“一站式”完成虚拟人的创建、驱动、内容生成 , 并具备感知、表达等无需人工干预的自动交互能力 。
近五年 , AI在虚拟数字人生成和驱动上展现了较高的效率 。 在《企业级AI数字人数字经济发展“新动能”》中 , 根据数字人拟人化程度 , 以及生产制作的自动化水平两个维度 , 数字人被分成五个等级 。
虚拟数字人的变迁:从小众走向共生
文章图片
图:数字人L1-L5等级(商汤智能产业研究院)
AI快速发展和融入行业的态势使得虚拟数字人融入各个行业的发展成为可能 。
虚拟数字人的变迁:从小众走向共生】报告指出 , L4和L5等级的数字人不仅具备高度的拟人化呈现 , 在形象、动作和智力层面都更接近于真人水平 , 能够听懂、看懂、有记忆、自学习 , 与人进行自然交互;同时 , 在制作流程中也融合了大量的人工智能算法技术来提升数字人的生产效率 , 降低了数字人的制作成本 。
目前 , 融合AI打造数字虚拟人以融合行业应用已经成为重要趋势 。
以科大讯飞为例 , 基于其自主研发的语音合成、识别、自然语言、图像处理等技术 , 创新发布虚拟生成、驱动、交互技术 , 搭建了科大讯飞AI虚拟人交互平台 。 该平台可以提供虚拟人形象构建、AI驱动、API接入、多场景解决方案 , 实现一站式的虚拟形象打造服务 。
目前 , 虚拟数字人在各行业已经得到了广泛应用 。 尤其是娱乐和传媒行业 , 虚拟偶像和虚拟主播赛道十分火热 , 这类虚拟数字人也赢得观众喜爱 。 在金融、教育、医疗、政企等行业 , 虚拟客服、虚拟老师、智医助手、数字员工等也开始出现 。
四、元宇宙催生数字虚拟人新赛道
2021年下半年 , 元宇宙点燃了整个市场 。 元宇宙作为虚实交融的空间 , 带来了无限的想象力 , 而进入元宇宙的第一步为打造“化身” 。 过去 , 互联网下的化身更多是2D的图像 , 而元宇宙中的化身将是“千人千面”的 , 代表用户的个人形象 。