以落地考验价值,大模型的产业大考来了( 二 )


一方面 , 基于通用的文心大模型挖掘特定行业应用场景中大量存在的行业特色数据和知识 , 进行大规模无监督的联合训练;另一方面 , 与行业专家一起探讨 , 引入行业实际业务积累的样本数据和特有知识 , 并在训练中结合业务经验 , 设计行业领域特色算法 , 使最终训出的行业大模型适配性更强 , 切实解决真实场景问题 。
特定行业数据、知识以及经验的加入 , 使得通用文心大模型真正做到了与行业的融会贯通 , 其能力的发挥也更加地有的放矢 。
以落地考验价值,大模型的产业大考来了
文章图片
对于合作企业、机构而言 , 加入行业特色数据与知识、精准匹配真实应用场景的行业大模型能够极大提升业务流程效率和水平 。
以百度联合吉利发布的知识增强的汽车行业大模型——吉利-百度·文心为例 , 它基于文心NLP大模型ERNIE3.0 , 结合了吉利汽车专业领域行业数据(汽车领域媒体知识、客服工单、法律法规以及汽车售后维修手册)进行预训练 , 充分理解掌握汽车行业知识 , 得到性能更强、稳定性更高的汽车领域大模型 。
目前 , 吉利-百度·文心已经应用于吉利的智能客服系统、车载语音系统和汽车领域知识库构建等业务场景中 , 实现显著的业务效率提升 。 随着将大模型等AI前沿技术应用于更多汽车业务中 , 双方还将以吉利-百度·文心大模型为通用底座 , 进一步支撑吉利在智能车机、知识资产管理和用户运营与智能营销等场景实现智能化升级 。
以落地考验价值,大模型的产业大考来了
文章图片
同样 , 其他四个新发布的行业大模型在对应的行业应用场景中也实现了任务效果的显著提升 。 但影响远不止此 , 文心大模型具备强泛化能力 , 因此除了适配已展示任务之外 , 将来可能针对更多相关领域任务进行训练微调 , 从而加速大模型在整个行业的落地 , 发挥更大的行业价值 。
从开启先河到体系初成 , 文心行业大模型内外两手抓
随着业界越来越认可行业大模型的发展模式 , 趋同在所难免 , 因此发展自己的核心竞争力尤为重要 。
在百度看来 , 行业大模型是结合行业落地过程中非常重要且有效的方式 , 今年以来陆续发布的11个行业大模型即是最好的例证 。 对于行业来说 , 它们得到AI技术力量的加持;对于文心大模型的建设来说 , 行业的反哺使得整个体系更强 , 基础通用大模型能力也得到提升 。
至于百度文心行业大模型如何保持优势?我们可以从「内秀」和「外拓」这两个建设思路具体分析 。
所谓「内秀」 , 即百度自身技术能力的持续积累 。 一方面 , 百度有自研的深度学习平台——百度飞桨 , 包括其上开发、训练、推理部署的能力、高效的工具与组件、广泛的硬件适配和生态等 , 所有这些为包括行业大模型在内的文心大模型提供支撑;另一方面 , 行业大模型自身也具有强沉淀性 , 它建模了大量的行业数据和知识 , 在整个应用过程中 , 又由应用反馈带来持续训练和进化 , 能力愈来愈强 。
所谓「外拓」 , 即百度联合各行各业的头部企业、机构 , 不断寻找与产业场景需求高度契合的领域 , 拓展行业大模型可能产生助益的范围 , 在与合作伙伴的深入技术交流和合作中充分释放大模型的价值 。
飞桨平台支撑文心大模型 , 加速产业智能化升级
在模型层 , 除了行业大模型之外 , 此次升级的百度文心大模型全景图中还新增了5个基础大模型 , 它们分别是知识增强轻量级大模型ERNIE3.0Tiny、跨模态理解大模型ERNIEViL2.0、跨模态生成大模型ERNIEViLG2.0、文档智能大模型ERNIE-Layout和单序列蛋白质结构预测大模型HelixFold-Single;1个任务大模型 , 即代码大模型ERNIE-Code 。