百度|AI复原600年传世名画,李彦宏要用AIGC颠覆内容行业( 二 )



数字人最早可追溯到2007年 , 以语音合成程序为基础开发的音源库“初音未来” 。 受限于技术 , 此后数字人多以二次元形象出现 , 直到2016年人工智能“绊爱” , 才让虚拟主播热潮席卷全球 。 2021年元宇宙概念大火后 , 数字人更是吸引无数企业聚焦、资本追逐 。

Web3浪潮涌动 , 数字人被赋予更多意义 , 从Web2世界里“工具性赋能”辅助角色 , 跃升为Web3世界不可或缺的基础设施——数字“原住民” 。

因此 , 国内外互联网大厂探索Web3 , 往往通过数字人“卡位”Web3的试验场和前哨阵地 。 数字人的市场价值也随之被持续抬高 , IDC报告显示 , 中国AI数字人市场规模呈现高速增长趋势 , 预计到2026年将达102.4亿元人民币 。

想赢得“卡位战”胜利并不容易 。 技术层面看 , 大多数字人仅能进行简单决策——大多依靠“2D或3D模型+实时动作捕捉+声优配音”模式 , 无法实现智能化交互 , 在业界属于2.0阶段 , 难以顺利实现撒贝宁的“十级粤语”点咖啡挑战 。

作为一种继UGC、PGC之后全新的内容生产方式 , 不断进化的AIGC——顾名思义 , 即人工智能自动生成内容 , 成为业界解题思路 。

AIGC并非新概念 , 近年来很多AI虚拟数字人用到了AIGC能力 。 2015年 , 国外曾出现两拨基于单点技术把产品迅速做火的AIGC案例 , 但受限于技术和成本 , 大多未能推广开来 。



行业对AIGC能力的要求 , 一直在升级之中 。 最早AIGC仅需要以假乱真 , 通过既定图片或语音生成风格一致内容 , 但在Web3时代 , 数字人用到AIGC , 除了基本的近真人需求 , 还要具有超强的创造力 , 像人一样学习沟通和工作 。

为什么数字人对AIGC能力要求越来越高?

“‘技术+应用+发展’三位一体 , 正在持续提升数字人产业‘天花板’ 。 ”市场调研机构IDC就指出 , PGC、UGC这样的生产模式 , 已不适应数字人本身的技术驱动和需求牵引 。

从产品技术趋势看 , 未来数字人将由AI驱动内容生成 , 多模态AI技术是核心;交互会越来越智能;形象越来越逼真 , 由拟人到类人到同人 , 只有AIGC才能实现 。

行业应用趋势看 , 未来几年人类与数字人开始并存;从产业落地趋势看 , 出行、产业、生活等千行百业正在加速向数字化转型和智能升级——这意味着 , 对AIGC能力的需求 , 并不局限在数字人行业 , 而是应用于各行各业 。


02 效率提升千倍 , 颠覆现有生产模式
仅就百度世界大会而言 , 如今百度AIGC能力输出已经可以达到近真人 , 甚至超越人类水平 。

度晓晓能秒懂完成撒贝宁的“刁钻提问” , 依靠的是不断进化的AIGC能力——不断汲取海量数据过程中 , 度晓晓的“自主能力”呈指数级增长 , 不仅能准确捕捉并判断用户搜索及服务类需求 , 和用户互动交流更为生动有趣 。 甚至 , 她还会反问用户意想不到的问题 。

这种有逻辑、有个性的交互、反馈 , 是度晓晓采用AIGC能力后 , 与其他数字人的最大不同 。

《富春山居图》山水最终“合璧” , 背后核心技术也来自AIGC的“自主”修复能力——尽管原画被焚烧部分后人已无法知晓 , 但在黄公望纪念馆负责人毛传镔看来 , “与现存真迹风格一致 , 光线风格统一 , 山水脉络和谐 , 不仅符合原画审美特点 , 视觉上还同样具有观赏价值” 。

真假难辨表现能力输出外 , AIGC更重要的是提升内容生产效率 , 让数字人的落地应用领域越来越广泛、越来越深 。