框架|百度要为中国AI的黄金十年搭好桥造好路( 二 )


百度知识增强大模型能够从大规模知识和海量无结构数据中融合学习,学习效率更高、效果更好,具有良好的可解释性。某种意义上来说,通过知识增强,使模型能够在一定程度上更好地理解世界是怎么运行的,也就更加智能。
这背后,是百度在知识图谱领域的十余年积累。百度早在2011年就开始研发知识图谱技术。截至目前,构建了包含5500亿知识的大规模知识图谱,覆盖生活的方方面面,也包括制造、医疗、法律、 金融、科技、媒体等领域的专业知识。
此外,人类的历史上有成千上万种语言,机器要想理解真实世界,也需要学习和理解多种语言的能力。人类是通过语言、语音、视觉等多种模态获得对真实世界的统一认知,机器如果想要理解真实世界也需要听懂语音、看懂图像视频,这就需要突破不同模态、异构信息的语义融合统一难题。可以简单理解为,机器需要综合理解文字、语言、图像、视频等不同媒介的信息。
百度文心能够实现跨语言、跨模态的学习,让百度大脑更好地支持各种AI应用,满足各种场景需求。百度的知识增强跨语言大模型ERNIE-M可同时从多种语言中学习,提升跨语言理解能力;知识增强跨模态理解大模型ERNIE-ViL在视觉常识推理任务榜单获得第一名;知识增强跨模态生成大模型ERNIE-ViLG实现文图双向生成,是全球规模最大中文跨模态生成模型。
在百度Create 2021大会上,百度首席技术官王海峰便现场展示了百度的知识增强大模型的跨模态理解与生成能力,王海峰在现场说了一句:“百度大脑,我们一起创作一幅水墨画吧。这边是连绵的山脉,山上云雾缭绕,山脚下有一座草堂建在江边,江上有 一条船,一个人站在船头;然后这边有一行飞鸟掠过天空。”百度大脑即刻便将王海峰语言文字的描述转换为一幅颇有意境的中国画来展现。
框架|百度要为中国AI的黄金十年搭好桥造好路
文章插图
在知识增强大模型的支撑下,百度大脑更好地支持金融、医疗、保险、证券、办公、互联网、物流等各种AI应用,满足各种场景需求。
降低AI使用门槛,在AI时代打造自主的底层系统
百度知识增强大模型等技术能加速创新的背后,离不开国产自主的AI深度学习平台飞桨和强大算力底座在背后的支撑。
计算机编程的产品是“程序”,深度学习研究的产品是“模型”,深度学习平台及其背后的深度学习框架,就如同不同品牌的积木,积木的各个组件相当于不同的模型或算法的一部分,开发者可以根据自己的不同需求选择各深度学习框架来进行产品模型的研发。
用一个不算准确的比喻来简单说明,深度学习框架在AI领域的重要程度,可能相当于PC时代的操作系统。虽然不同的深度学习框架、不同的“操作系统”都能实现某一深度学习目标,但在人工智能时代提前做好AI的底层操作系统——深度学习框架,对我国在芯片、光刻机、手机电脑的操作系统等方面遭人“卡脖子”的当下异常重要。
深度学习和国有自主的深度学习框架也是推动人工智能进入工业大生产阶段的关键。早在2017年国务院就印发了《新一代人工智能发展框架》,明确提出在2030年中国要成为世界主要人工智能创新中心。面向技术和产业发展需求的AI大生产平台可以让AI技术以标准化、自动化和模块化的方式输出给千行百业,实现规模化应用,同时以平台为基础促进融合创新、共同发展。也因此,中国更需要本土的AI创新基础来为庞大的中国AI产业与开发集群服务。
其实深度学习框架本身的搭建并不算难,很多研究人员或公司都会自己搭建一个深度学习平台,但要想搭建一个通用性广的深度学习框架却是一件不容易的事。好的深度学习框架源于产业实践,一个深度学习框架只有参与过千行百业的AI模型部署实践,见过无数种千奇百怪的硬件组合,最后能使用于各种情况能搭配各类方案,像USB插口一般“即插即用”,使得让模型上线工作事半功倍,才能叫“产业级”的深度学习框架。