阿里巴巴|全球最大!阿里云推飞天智算平台,单集群算力超12EFLOPS

阿里巴巴|全球最大!阿里云推飞天智算平台,单集群算力超12EFLOPS

文章图片

阿里巴巴|全球最大!阿里云推飞天智算平台,单集群算力超12EFLOPS

文章图片

阿里巴巴|全球最大!阿里云推飞天智算平台,单集群算力超12EFLOPS

文章图片

阿里巴巴|全球最大!阿里云推飞天智算平台,单集群算力超12EFLOPS


作者 | 李水青
编辑 | 漠影
智东西8月30日消息 , 今日 , 阿里云宣布推出智能计算解决方案“飞天智算平台” , 并启动位于张北和乌兰察布的两座超级智算中心 , 算力规模合计15 EFLOPS(每秒1500亿亿次浮点运算) , 成为全球最大规模智算平台 。
简单来说 , 智算中心是指专门面向人工智能应用的数据中心 。
飞天智算平台是阿里云推出的智算中心升级方案 , 向下支持“一云多芯” , 提供大规模融合算力;向上兼容通用及智能算力场景 , 以公有云和专有云两种模式为产学政客户提供全栈AI开发和模型能力 。
阿里云智能全球销售总裁蔡英华说 , 当下 , 中国企业采用人工智能比例达58% , 居于全球首位 , 数据智能应用正驱动算力基础设施升级 , 智能算力成为数字经济新引擎 。
让自动驾驶模型训练提速170倍 , 助靶向药研究数据集计算效率性能提升100倍 , 十万亿参数AI大模型1分钟内训练完成……阿里云公布的一组组数据展现出智算技术带来的效率革命 。

随着东数西算推进 , 我国智算中心建设已在京津冀、内蒙古、长三角等8地国家算力枢纽节点拉开序幕 。 据工信部统计 , 目前全国建成和在建的智算中心已有20多座 。 在产业界 , 云计算大厂、ICT企业、运营商都已入局 。
与此同时 , 新的问题也在出现——行业究竟需要什么样的智算服务?海量智能算力如何真正被用起来?通过对话阿里云智算系统的负责人曹政 , 我们对智算中心的应用情况 , 以及背后的技术和产业真相有了深入了解 。
一、让自动驾驶AI训练提速170倍 , 阿里云推全球最大智算平台2022年7月 , 在北京中关村写字楼中 , 小鹏汽车的工程师仅用1个小时 , 训练出一个原本需要7天完成的自动驾驶核心模型 。 而在300多公里外的乌兰察布的草原上 , 一个算力规模达600PEFLOPS的智算中心正高速运转 , 这是让小鹏AI模型训练提速近170倍 , 成本降低62%的幕后“发动机” 。
在取得这一标杆成绩之后 , 今日 , 阿里云宣布正式推出飞天智算平台 。
这是一个阿里云为智算提供的全栈能力体系 , 也是助力小鹏自动驾驶智算中心中的核心平台 。 在客户视角 , 它相当于智算中心的操作系统 , 内部则涵盖一个智能计算系统、大数据和AI开发平台层 , 以及最上层的AI模型服务层 。

近年来 , 汽车、生命科学、工业、元宇宙等各个领域数智化发展迅速 , 随之而来的是超大规模AI模型和海量数据 , 都对智能算力提出了更高要求 。 一般的数据中心也可以做AI , 但算力在数据迁移、同步等环节损耗往往可能超一半 , 成本高昂 , 大大阻碍了产业发展 。
作为国内第一大云计算公司 , 阿里云用飞天智算平台来助产业破解这一算力瓶颈 。
向下 , 飞天智算平台会管理智算集群 , 适配多种类型芯片;向上 , 它搭载了全栈AI开发和模型能力 。 根据阿里云官方数据 , 飞天智算平台可将计算资源利用率提高3倍以上 , AI训练效率提升11倍 , 推理效率提升6倍 , 并将PUE(电源使用效率 , 越靠近1表明效果越好)降低至1.09 , 远优于东数西算提出的1.25标准 。