在视觉内容生成方面 , 视频生成大模型可以根据用户提供的一段描述文本 , 或者一幅图像 , 自动地生成高清、流畅的视频 。
在视觉编辑方面 , VIMER-TCIR多任务大模型 , 则可以利用对超分辨率、去噪、去模糊、去压缩等多任务的联合预训练 , 同时实现对多种不同情况的修复和编辑 。
目前 , VIMER-TCIR已经在老电影修复等场景实现落地 , 而且大幅提升了运行效率 , 每天单机就可修复视频28.5万帧 , 解决了绝大部分老电影画面的修复问题 。
AIGC的浪潮已经到来 , 在未来 , 可以预见的是 , AI作画、AI创作视频等等 , 很快就会变得像手机拍照一样简单 。
随着技术的不断突破 , AIGC将很有可能颠覆现有内容生产模式 , 实现以十分之一的成本 , 以百倍千倍的生产速度 , 创造出有独特价值和独立视角的内容 。
研发资金拉满:10年投入超1000亿
为了让大模型达到如此酷炫的效果 , 百度在研发方面 , 可谓是毫不吝啬 。
十年间累计投入了超过1000亿元 , 其中核心研发投入占核心收入比例连续8个季度超过了20% 。
据统计 , 百度在2020年的研发投入强度为18.22% , 位列民营企业500强第一 。 2021年为20.03% , 位列民营企业500强第二 。
顺便一提的是 , 如此「豪横」的投入 , 也让百度在人工智能的底层技术方面 , 取得了领先优势 。
毕竟 , 芯片卡脖子要紧 , 基础软件卡脖子也一样要紧 。
早在2016年 , 百度就开始研发被称为「人工智能操作系统」的深度学习框架——飞桨 。
目前 , 已经凝聚了535万开发者 , 创建了67万个模型 , 构建起一个繁荣的深度学习生态 。
基于飞桨的大模型也可以有效集成自然语言处理、计算机视觉等多模态能力 , 并联合多种行业务场景进行调优;而开发者也能像搭积木一样构建AI应用 , 大大降低AI的应用门槛 。
李彦宏:人工智能的黄金十年
文章开头我们已经提到 , 李彦宏认为 , 与深度学习相关的重大创新 , 包括自动驾驶、水电能等领域的智能调度系统等 , 会产生重大社会影响 。
创新本身是从何而来呢?在李彦宏看来 , 创新 , 是由反馈驱动的 。
百度在经营发展中 , 就有很多「反馈驱动创新」的实践经验 。 比如 , 百度昆仑芯片之所以在AI芯片中拥有领先的性能 , 正是因为它已经为百度的搜索服务优化了十年 。
百度的搜索服务 , 每天响应几十亿次真实的用户使用需求 , 每天进行1万亿次深度语义推理与匹配 , 能够提供最真实、最及时的反馈 , 从而倒逼大模型、深度学习框架和芯片的优化 。
现在 , 百度是全球为数不多的、进行全栈布局的人工智能公司(芯片层、框架层、模型层和应用层) 。
从高端芯片昆仑 , 到飞桨深度学习框架 , 再到文心预训练大模型 , 各个层面都有关键自研技术 , 每一层之间都有很多反馈 , 通过不断获得反馈 , 实现端到端优化 。
每一层的技术架构 , 都是越往下越通用 , 越往上越专用 。
而人工智能越专用 , 就越能深入产业 , 赋能实体经济发展 。
去年的Create大会上 , 李彦宏曾预言:「随着技术应用门槛不断降低 , 创造者们将迎来属于人工智能的黄金10年 。 」如今 , 他依旧这样认为 。
2020年 , 李彦宏刚刚创业时 , 就面临着互联网泡沫破裂 , 全世界蒸发8万亿市值 , 随后 , 互联网又进入了黄金十年 , 而人工智能 , 也会经历同样的起起落落 。
而百度 , 将一如既往为社会、为产业培养AI人才 , 投入更多资源 , 与各位开发者们一道 , 为中国AI的发展尽最大的努力 。
- 营收|智能时代转折点:百度为何提出“深度学习+”?
- 杨元庆|十年千亿,百度知春
- vivo|10年前的vivo Xplay3S被博主用来当蓝牙音箱:音质一绝
- 百度|北斗童知AI+AR双智能地球仪开箱分享:足不出户开启孩子全球视野
- ape|百度“栽树”十年,人工智能大展宏图
- 大数据|百度穿越周期,雪里已知春信至
- 3D打印|用科技提升情商?百度输入法新功能来袭,聊天真不怕了
- javascript|从两肋插刀到兄弟反目,起底罗永浩与郑刚10年的恩怨始末
- 百度|李彦宏:芯片卡脖子很要紧 但软件卡脖子一样要紧
- |实录|百度云的2023,李彦宏画了个框