以落地考验价值,大模型的产业大考来了

机器之心原创
作者:杜伟在今日举行的百度WAVESUMMIT+2022深度学习开发者峰会上 , 百度产业级深度学习开源开放平台飞桨以及产业级知识增强大模型文心均迎来了重大升级 , 其中大模型的产业化路径和文心行业大模型的实践成为峰会的焦点 。
从BERT和GPT-3发展至今 , 大模型已然成为当前AI发展的重要方向 。 大模型增强了AI的通用性 , 构筑了AI技术和应用的坚实基座 。 在这股不可阻挡的大模型发展潮流中 , 各家大厂纷纷投入大量资金、人才和配套服务 , 从数据、算法和算力多方面推进大模型的研制、训练和建设 。
行业的投入使大模型迎来显著进展 , 千亿甚至万亿参数的大模型陆续出现 , 覆盖了NLP、CV和跨模态等领域 。 然而 , 只有落地才能实现大模型的价值 。 各家不断探索大模型落地的新方法、新模式 , 作为国内AI领域的领头羊 , 百度持续发力自身文心大模型体系 , 形成产业级和知识增强两大核心特性 。
今年5月 , 百度提出了要构建更适配应用场景的模型体系 , 最亮眼的发布就是业界首发两个行业大模型——国网-百度·文心和浦发-百度·文心 。 此后行业大模型成为文心着力的重点 , 7月推出世界首个航天领域大模型——航天-百度·文心 。 近日又相继推出传媒行业大模型——人民网-百度·文心、影视行业智感超清大模型——电影频道-百度·文心、智慧城市领域大模型——冰城-百度·文心 。
百度并没有止步于此 , 而是致力于将大模型应用拓展到更广泛的行业领域 。 在11月30日举行的WAVESUMMIT+2022深度学习开发者峰会上 , 百度文心产业级知识增强大模型全景图迎来升级 , 在全新发布的11个大模型中 , 包括5个行业大模型 , 分别是泰康-百度·文心、深燃-百度·文心、吉利-百度·文心、TCL-百度·文心以及辞海-百度·文心 。
以落地考验价值,大模型的产业大考来了
文章图片
在仅仅半年的时间里 , 百度文心行业大模型的数量已经达到了11个 , 覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域 , 进一步丰富了行业大模型的应用场景 , 在产业化落地的过程中使大模型真正赋能千行百业 。
更多行业大模型的发布彰显出百度文心大模型践行自身产业级特性的决心 , 无论是从如今行业大模型的数量还是覆盖行业范围而言 , 百度显然已经初步形成自身大模型产业化落地的行业布局 。
在峰会上 , 百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士表示 , 具有算法、算力和数据综合优势的企业 , 可以将模型生产的复杂过程封装起来 , 通过低门槛、高效率的生产平台 , 为千行百业提供大模型服务 , 从而形成一条大模型产业化路径 。
契合场景需求、加速AI落地 , 文心行业大模型不断壮大
大模型的发展从来不是一蹴而就的 , 从数据采集到模型开发、训练、推理部署再到最后的落地 , 关关难过但又必须过 。 在实现落地的最后一环上 , 研发契合场景需求的行业大模型成为业界采取的主要发展模式 , 而正是百度开启了先河 。
文心行业大模型植根于文心大模型 , 在NLP、CV和跨模态等基础通用大模型掌握通识知识的基础上 , 对行业知识、数据、经验和任务进行更深入的了解 , 达到在特定行业、特定应用场景中的性能最优 。 文心行业大模型的打造 , 就是要解决大模型与应用场景之间的鸿沟 。
百度通过联合头部企业和机构 , 秉持「从产业中来 , 到产业中去」 , 不断将大模型技术融入到更多行业和应用场景中 。 在这一过程中 , 文心行业大模型逐渐形成自己的核心特色——行业知识增强 。