百度|AI复原600年传世名画,李彦宏要用AIGC颠覆内容行业( 四 )



2016年 , 百度打造了中国第一个自主研发、开源开放的产业级深度学习平台飞桨 。 2019年 , 基于飞桨 , 百度开始深耕预训练模型研发 , 从大规模知识和海量数据中融合学习 , 打造具备“知识增强”能力的文心大模型 。



比如 , 数字人画画能力 , 使用的是文心大模型——跨模态图文生成模型ERNIE-ViLG;而人对话能力 , 使用的是对话生成大模型——文心 PLATO , PLATO有接近真人水平的对话能力 , 对话效果已经达到世界领先水平 。

《富春山居图》合璧 , 就是文心大模型能力完整体现:其先是学习大量中国山水画 , 实现从“小白”向“大师”的进阶 , 再去学习就可以让补全出来的画作与现存真迹风格一致 。

这就是“视觉生成大模型+单样本微调”的技术策略 , 意味着该模型可以在更多书画文物修复以及普通人书画艺术创作中 , 发挥重要作用 。

AIGC方向外 , 文心大模型还广泛应用于搜索、信息流、智能音箱等互联网产品 , 并通过飞桨开源开放平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业 , 帮助千百行业降本增效以及智能化升级 。

这正是百度大脑、飞桨和文心大模型等综合AI技术的核心价值——降低制作成本 , 实现大规模应用 。

在数字人产业 , 更是帮助百度解决落地难问题的关键——产业链割裂、服务场景与演艺场景没有有效打通、满足高频需求成本高 , 是当前业界公认的数字人落地难题 , 也是实现“数字人自由”的最大障碍 。

这些问题 , 归根结底是数字人生产效率、制作成本问题 。 百度解题思路是 , 通过AI底层技术支撑和成熟实践 , 打造了数字人平台“百度智能云曦灵” , 让数字人制作成本、生产周期大幅下降 。



目前“曦灵”形成了一个“AI数字人家族” , 拥有数十万度晓晓这样能力的数字人 。 最重要的是 , 普通用户也可以通过“曦灵”快速生成自己的数字人——只需上传一张照片 , 就能用分钟级生成一个可被AI驱动的2D数字人像 , 以前需要两三个月时间做出来的3D数字人 , 现在可以压缩到一两周 。 并且 , 这些数字人的AIGC能力非常成熟 , ASR(听得清)准确性可达98%以上 。

多位业内人士认为 , 这是实现“数字人自由”的重要方向:一方面通过标准化、平台化 , 吸引更多用户、企业、行业拥有数字人;另一方面基于平台打造的生态链服务 , 降低数字人的高门槛、高投入 。

这让百度在数字人行业有更大领跑机会 。 百度“AI数字人家族”原来集中在金融、银行、供应商客户 , 现在增加到广电、互联网娱乐、传统工业等诸多B端客户 , 另外C端的需求也越来越多——比如诸多品牌商的虚拟代言人合作需求 。

04 叩门Web3.0 , 百度体现中国力量
“未来每个企业、每个人都有一个、甚至多个专属的数字人 。 ”2019年4月 , 李彦宏在百度与浦东银行的数字人合作会上如此表示 。

两年过去 , 伴随B端、C端齐头快跑 , 更多数字人各种场景的落地应用 , 这个愿景逐渐变成现实 。

这一切 , 源于百度对AI领域压强式、马拉松式的研发投入 。 公开数据显示 , 研发投入方面 , 2021年百度核心研发费用221亿元 , 研发投入强度位列中国民营企业500强第一位 。

如今 , AI早已成为百度引擎之一 。 飞桨、文心大模型、深度语音系统、百度大脑、度秘、Apollo自动驾驶平台等多个AI相关的技术 , 都是百度不计成本投入的注脚 。