人工智能|全球首个知识增强千亿大模型亮相

12月8日 , 鹏城实验室与百度联合发布全球首个知识增强千亿大模型——鹏城—百度·文心 。
为什么大模型在产学界持续走热 , 越来越多的技术公司入场?
如中国工程院院士、鹏城实验室主任高文所言 , 预训练模型赋能人工智能衍生更多的应用 , 而不局限于某个领域 , 是人工智能自身发展并作用于社会及科学创新的重要工具 。
当人工智能的需求呈现出碎片化、多样化的特点 , 人工智能模型却存在很多挑战 , 通用性低是首要问题 。 也就是说 , A模型往往专用于特定A领域 , 应用到B领域便差强人意 。
百度首席技术官王海峰介绍 , 鹏城—百度·文心是全球首个知识增强千亿大模型 , 参数规模达2600亿 。 在机器阅读理解、文本分类、语义相似度计算等60多项任务上取得最好效果 , 并在30余项小样本和零样本任务上刷新基准 。
百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜说:“60多项不同的任务 , 说明大模型的通用性很强 , 30余项小样本和零样本任务刷新基准 , 则意味着大模型泛化能力更强 , 对支撑各行各业非常重要 。 ”
鹏城—百度·文心希望解决传统人工智能模型泛化性差、强依赖昂贵人工标注数据、落地成本高等应用问题 , 希望成为千行百业人工智能开发的首选基座大模型 。
而鹏城实验室的算力系统“鹏城云脑Ⅱ”和飞桨深度学习平台就是鹏城—百度·文心理想实现的关键支撑 , 解决了超大模型训练的多个公认技术难题 。
作为产业级知识增强大模型 , 文心包含自然语言理解大模型、计算机视觉大模型和跨模态大模型 , 既指向基础通用的 , 也面向重点领域和重点任务 , 还有丰富的工具与平台 。 “知识增强”是它的核心特色 。
知识是人类智慧的结晶 , 是人类进步的重要推动力 。 通过知识增强 , 计算机有了学习并运用知识 , 像人一样理解和认知世界的可能 。
吴甜强调:“我们希望人工智能系统通过对知识的学习 , 能够提升学习效率 , 具有更好的可解释性 , 更符合人对事物的理解 。 ”
【人工智能|全球首个知识增强千亿大模型亮相】文心大模型正通过百度飞桨平台陆续对外开源开放 , 已大规模应用于百度搜索、信息流、智能音箱等互联网产品 , 并赋能工业、能源、金融、通信、媒体、教育等各行业 。 采访人员 刘 艳