m6|破10万亿!达摩院实现全球最大AI预训练模型:远超谷歌、微软
在人工智能前沿领域,中国AI实现突破。
11月8日,阿里巴巴达摩院公布多模态大模型M6最新进展,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级模型,成为全球最大的AI预训练模型。
同时,M6做到了业内极致的低碳高效,使用512 GPU在10天内即训练出具有可用水平的10万亿模型。
相比去年发布的大模型GPT-3,M6实现同等参数规模,能耗仅为其1%。
M6是达摩院研发的通用性人工智能大模型,拥有多模态、多任务能力,其认知和创造能力超越传统AI,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。
与传统AI相比,大模型拥有成百上千倍“神经元”数量,且预先学习过海量知识,表现出像人类一样“举一反三”的学习能力。
因此,大模型被普遍认为是未来的“基础模型”,将成下一代AI基础设施。然而,其算力成本相当高昂,训练1750亿参数语言大模型GPT-3所需能耗,相当于汽车行驶地月往返距离。
今年5月,通过专家并行策略及优化技术,达摩院M6团队将万亿模型能耗降低超八成、效率提升近11倍。
10月,M6再次突破业界极限,通过更细粒度的CPU offload、共享-解除算法等创新技术,让收敛效率进一步提升7倍,这使得模型规模扩大10倍的情况下,能耗未显著增加。
这一系列突破极大降低了大模型研究门槛,让一台机器训练出一个千亿模型成为可能。
文章插图
同时,达摩院联合阿里云推出了M6服务化平台,为大模型训练及应用提供完备工具,首次让大模型实现“开箱即用”,算法人员及普通用户均可方便地使用平台。
达摩院还推出了当前最大规模的中文多模态评测数据集MUGE,覆盖图文描述、文本生成图像、跨模态检索任务,填补了缺少中文多模态权威评测基准的空白。
文章插图
作为国内首个商业化落地的多模态大模型,M6已在超40个场景中应用,日调用量上亿。
今年,大模型首次支持双11。M6在犀牛智造为品牌设计的服饰已在淘宝上线;凭借流畅的写作能力,M6正为天猫虚拟主播创作剧本;依靠多模态理解能力,M6正在增进淘宝、支付宝等平台的搜索及内容认知精度。
文章插图
M6生成的未来感汽车图
达摩院智能计算实验室负责人周靖人表示,“接下来,我们将深入研究大脑认知机理,致力于将M6的认知力提升至接近人类的水平,比如,通过模拟人类跨模态的知识抽取和理解方式,构建通用的人工智能算法底层框架;另一方面,不断增强M6在不同场景中的创造力,产生出色的应用价值。”
【 m6|破10万亿!达摩院实现全球最大AI预训练模型:远超谷歌、微软】据了解,达摩院语言大模型PLUG近期也已升级至2万亿参数,成为全球最大中文语言模型,其所属AliceMind语言模型体系同样推出了服务化平台。
- text|《2021大数据产业年度创新技术突破》榜重磅发布丨金猿奖
- 儿童教育|首个播放量破 100 亿的 YouTube 视频诞生,竟然是儿歌
- 攻克|打破日本垄断!售价7亿元的设备被中企攻克,已开始量产
- 智能|地震救人新突破!中科院研制出触嗅一体智能仿生机械手
- 2599起!曾经破万的折叠屏,现在还有人买吗?
- 图灵奖|中国科技团队创历史,360打破行业垄断,登顶世界最强人工智能榜
- 上海微系统与信息技术研究所|地震救人新突破!中科院研制出触嗅一体智能仿生机械手
- 高通骁龙|女子为面子买苹果手机,贷款105万最后弄得支离破碎
- 年货|华硕破晓Pro14 年货节是低价格4299元
- “最敬业”的手机代言人,厂商欠债173亿破产,他却仍在继续使用