神龙|阿里底层自研技术大爆发!推龙蜥操作系统、第四代神龙架构,AI大模型M6参数破10万亿

神龙|阿里底层自研技术大爆发!推龙蜥操作系统、第四代神龙架构,AI大模型M6参数破10万亿
文章插图
智东西(公众号:zhidxcom)
作者 | 李水青
编辑 | 心缘
智东西10月20日消息,在今年“元宇宙”、机器人等五花八门应用荟萃的阿里云栖大会上,阿里云照例带来一场关于底层技术创新的盛宴。
今天上午在杭州云栖小镇主会场,阿里宣布推出飞天云操作系统新一代虚拟化技术第四代神龙架构,发布全新操作系统“龙蜥”并宣布开源,同时,推出宣布自研云原生关系型数据库PolarDB重磅升级,实现内存池化、多主架构、HTAP实时分析等创新功能。
此外,阿里还推出大数据+AI一体化平台“阿里灵杰”,这一平台已支持达摩院多模态大模型M6已升级至全球首个突破10万亿参数的AI模型,规模超越此前谷歌发布的1.6万亿Switch Transformer模型。
在“双碳”背景下,阿里云也更重视科技减碳。阿里巴巴集团副总裁、阿里云智能基础设施事业部总经理周明宣布,阿里云将加速在新型数据中心内清洁能源的使用,位于河源的数据中心最快明年将100%使用清洁能源。
一、发布并开源龙蜥操作系统,投入20亿会上,阿里巴巴集团副总裁、阿里云智能基础产品事业部负责人蒋江伟带来《永不止步的云上创新》演讲,宣布发布并开源全新“龙蜥”操作系统、飞天云操作系统新一代虚拟化技术第四代神龙架构,同时,阿里达摩院操作系统实验室也宣告成立。
据蒋江伟解读,龙蜥操作系统定位于服务器端,支持X86、ARM等多种芯片架构和计算场景,在阿里巴巴打磨十年且有效支撑了历年天猫双11。据称龙蜥针对云原生应用开发做了多重优化,为云上典型场景带来40%的综合性能提升,故障率降低50%,兼容CentOS生态,支持一键迁移并提供全栈国密能力。
神龙|阿里底层自研技术大爆发!推龙蜥操作系统、第四代神龙架构,AI大模型M6参数破10万亿
文章插图
蒋江伟宣布,龙蜥操作系统完全开源,通过开源社区和操作系统厂商等形式提供服务。未来,阿里云计划为龙蜥投入20亿专项资金,并联合100家生态合作伙伴推动生态建设,提供至少十年技术支持。
二、飞天云操作系统更新,推出第四代神龙架构除了龙蜥操作系统,阿里云还带来了飞天云操作系统新一代虚拟化技术,第四代神龙架构。
飞天是阿里云在2009年推出的自研超大规模通用计算操作系统,可以将遍布全球的百万级服务器连成一台超级计算机,以在线公共服务的方式为客户提供计算能力,多年来不断迭代,成为阿里支持国家新型基础设施建设战略的一大底座。
蒋江伟指出,第四代神龙架构最大特征就是对IO进行了加强。通过芯片加速IO引擎,不用改代码实现性能优化。举个例子,阿里有一家供应商,提供供应链系统,前两年为了优化性能,需要3-6个月时间做分布式架构改造。现在基于神龙架构4.0,能够不修改代码直接升级。
神龙|阿里底层自研技术大爆发!推龙蜥操作系统、第四代神龙架构,AI大模型M6参数破10万亿
文章插图
作为飞天操作系统新一代虚拟化技术,除了IO加速,第四代神龙架构还在芯片级安全、云原生弹性和高速网络领域做出优化,将云计算首次带进5微秒时延时代。
尤其在高速网络方面,据称,第四代神龙架构首次搭载全球唯一的大规模弹性RDMA加速网络,网络延迟整体降低80%以上。蒋江伟公布了一组测试,可以看到,在Nginx SSL场景下,第四代神龙架构比前代性能最高提升40%,在指定规格的虚拟场景下,eRDMA对比TCP性能最高提升30%。
神龙|阿里底层自研技术大爆发!推龙蜥操作系统、第四代神龙架构,AI大模型M6参数破10万亿
文章插图
此外,据称在深度学习场景下,第四代神龙可提升分布式NLP和视觉计算30%的训练性能;在大数据场景下,可提升Spark30%的计算性能;在数据库场景下,MySQL性能最高提升60%、Redis混合读写吞吐量可提升130%;NginxSSL建连每秒吞吐性能提升420%。