“AI造人师”:“人均一个数字人的时代”正在到来( 三 )


在对话这个维度上 , 随着大模型技术的不断进步 , 数字人在语言交互上的训练成本也能进一步降低 。 最近 , 我们发布了百度智能云的对话平台UNIT7.0 , 平台化的产品使得数字人这种对话配置、多模交互的能力更加易用 , 使用成本也更低 。
就内容生产维度来说 , 我们现在可以采集大量的数据训练集 , 这些捕捉的数据 , 可以完成自动修复 。 比如 , 我们在做央视新闻的手语项目时 , 每一个手语动作都是一条数据 , 我们采集了上万个手语动作 , 并予以修复 , 为我们的听障用户服务 。
这个成本其实是非常高的 , 但正是因为有了大量的数据积累 , 我们才能将自动化修复的时间成本缩短至少80% , 预算成本能节省60%—70% 。
“AI造人师”:“人均一个数字人的时代”正在到来
文章图片
百度智能云·曦灵AI手语平台 。
未来的元宇宙里 , 数字人将占据核心位置
《新周刊》:目前数字人的市场需求如何?
李士岩:数字人的需求主要集中在两个方向 , 分别是多模交互方式和内容生产 。 在多模交互方式方向 , 数字人的工作主要是做业务员 , 也就是理财经理、教育培训领域的一对一交互教练等 。 在内容生产维度上 , 数字人做的主要是虚拟主持人、虚拟主播和虚拟偶像 。
目前来看 , 这两个大赛道每年成长率都较高 , 每年可触达的市场规模几乎都是翻倍的 。 预测到2023年 , 这个市场规模接近300亿元 。 虚拟偶像大概占到60% , 虚拟员工、虚拟主持人和带货主播 , 占到40%—50%的规模 。
“AI造人师”:“人均一个数字人的时代”正在到来】《新周刊》:数字人的客户群体和实际应用怎样?
李士岩:在运营商行业 , 我们已经做了大量的案例 , 比如我们给银行等机构都提供过虚拟员工类的服务 。 以银行App为例 , 百度智能云的数字人能为用户提供金融服务;到了线下场景 , 银行的网点里 , 也有数字人的智能屏帮助客户办理业务 , 从而解决线下排队等一些问题 。
在内容生产方面 , 也就是我们内部所说的“演艺型数字人”赛道 , 我们给央视做了相应的虚拟主持人或手语主持人 , 这在冬奥会、冬残奥会、NBA等一些赛事上 , 已经服务了几千万名听障用户 。
《新周刊》:你提到的用户群体 , 更多的是一些大企业 , 对于那些中小企业或机构 , 它们在数字人方面有哪些选择?
李士岩:现在数字人应用的行业瓶颈是应用节点较多 , 成本较高 。 针对目前这种情况 , 我们的做法是 , 通过一些标准化的SaaS产品(SoftwareasaService , 即通过网络提供软件服务) , 让一些中小企业也能获得数字人服务 。
现在 , 直播是不可或缺的运营手段 , 但一个小企业想要自己搭建专业的直播间 , 成本较高 , 场地、设备 , 外加主播 , 可能要花几十万元 。 针对类似问题 , 我们发布了百度智能云·曦灵数字人直播平台 , 它现在是市面上唯一能达到影视级的超写实数字人 , 也是可通过AI驱动实现24小时自动直播的产品 。 相较于定制化的数字人 , 这种平台级的SaaS软件的应用成本要低得多 。
《新周刊》:数字人兴起和最开始的元宇宙风口有较大关系 , 作为从业者 , 你觉得数字人对于我们未来在元宇宙中的生活 , 会有哪些影响?目前还存在哪些挑战?
李士岩:无论平台怎么进化 , 用户在里面做的事情是相似的——社交、获取服务和消费内容 。 在这些领域 , 用户都必须拥有一个“二分身” 。 “二分身”就是典型的数字人应用 。 所以 , 根据我们的判断 , 无论是作为进入元宇宙的通行证 , 还是未来在元宇宙中提供服务 , 数字人都占据非常核心的位置 。 在生活方面 , 我们能发现 , 数字人已经提供了诸多便利 , 它可以让银行的服务变得更有温度 , 让教育变得更有效率 , 那些虚拟偶像也通过聊天 , 给予了我们更多陪伴 。