桐乡|李彦宏为什么说AI发生了方向性改变( 二 )


这其中最明显的例子就是在ILSVRC偃旗息鼓那一年诞生的Transformer架构 , 被很多人称为“2010 年代十年中最伟大的发明” 。 它的诞生让更为高效的“多头注意力机制”技术路线 , 取代了之前的卷积神经网络 , 成为更优秀的AI解法 。

图片来自著名的《Attention Is All You Need》论文
Transformer诞生后 , 谷歌搞出了架构Vision Transformer (ViT) , OpenAI 发布了 DALL·E-2 , DeepMind 发布了 AlphaCode , 等等 。
就在李彦宏发言中特别提到的2021-2022年 , AI还取得了十分引人注目的进步 , 那就是既有震动科技界的优秀论文(MLP-Mixer , 2021) , 宣称卷积神经网络和注意力之外 , 还有其他的AI进阶实现路线;亦有香港中文大学研究室在论文中极具突破性提出 , Transformer可以与GAN(生成对抗网络)结合实现AI效率倍增 。
显然 , 作为以AI技术为核心竞争力的科技公司CEO , 李彦宏与百度技术中台群组(TPG)、百度研究院 , 肯定会保持对这些AI领域最新研究成果的密切关注 。 只不过 , 在面向公众演讲之时 , 李彦宏使用了一个高度概括且更容易理解的词汇——AIGC , 去涵盖自身对AI技术方向性改变的理解 。
用李彦宏的话说就是:“这里的方向性改变是 , AI从理解语言、理解文字、理解图片和视频 , 走向了生成内容 。 我们称之为AIGC , 即人工智能自动生成内容 。 ”

由文字生成的AI画作《太空歌剧院》 , 获得美国科罗拉多博览会年度艺术比赛的“数码艺术”组别冠军 。
的确 , 李彦宏的观察结论与科技行业从业者感知的完全相符 。 比如李彦宏在演讲中提到的AI作画 , 这已经比当年震惊科技界的谷歌识图不知高出了几许 。

《经济学人》编辑团队在《Midjourney》上经过250次的文字输入尝试 , 生成了1000张缩图 , 再从中挑选出一张制成2022年6月出版的杂志封面图片 。
此外 , 还有AI创作文章 , AI预测一个人的老年阶段相貌 , AI根据文字生成图片 , 等等 。
实际上 , 李彦宏所指出的 , 正式是一条从机器识别 , 到机器理解 , 再到机器创造的AI转型之路 , 或者称升级之路 。

李彦宏演讲中提到的AI作画 , 仅仅是AI技术在商业应用领域打开想象力的一个代表 。
实际上 , 在近两年 , 连AI理论研究领域都取得了如此重要的进展 , 商业应用层面就更是百花齐放 , 百度自身就是一个非常好的例子 。
比如 , 在AIGC领域 , 其背后是大模型技术 , 近些年来 , 伴随数据井喷、算法进步 , 以及算力突破 , 预训练大模型成为人工智能发展的新方向 。 百度文心大模型作为产业级知识增强大模型 , 真正源于产业实践 , 又服务于产业落地 。 在大模型的产业落地上 , 百度首发行业大模型 , 探索出一套行之有效的大模型产业落地打法 , 让大模型“能用、可用” , 规模化落地价值显现 。
据了解 , 文心·行业大模型基于通用的文心大模型 , 融合学习行业特有的大数据和知识 , 进一步提升大模型对行业应用的适配性 。 在能源电力领域文心大模型联合国家电网研发知识增强的电力行业NLP大模型国网-百度·文心 , 在金融领域联合浦发银行研发知识增强的金融行业NLP大模型浦发-百度·文心 , 通过引入行业特色数据和知识 , 在电力、金融相关领域取得显著的效果提升 。 在航天领域 , 文心大模型携手中国航天发布世界上首个航天大模型——航天-百度·文心大模型 , 推进航天领域AI技术应用 。
百度的AI 数字人度晓晓 , 今年挑战创作高考作文 , 在40秒内写了出40 篇 , 经过专家评阅 , 其得分可以排在总考生前 25% 。