超算|“全球最强智算”王座 刚刚易主:阿里一举击败谷歌

“全球最强智算”王座,刚刚易主 。
来自中国河北省张北县的“中国选手”,一举击败谷歌 。
超算|“全球最强智算”王座 刚刚易主:阿里一举击败谷歌
文章图片

△图:张北县草原
而其所凭借的算力值,每秒浮点运算次数已经高达12EFLOPS(百亿亿次) 。
超算|“全球最强智算”王座 刚刚易主:阿里一举击败谷歌
文章图片

相比之下,谷歌单集群算力峰值是9EFLOPS,特斯拉也仅有1.9EFLOPS 。
那么张北县的这个“速度”,到底有多快?
举个例子 。
以前要训练一个自动驾驶的模型,大概需要花费的时间是7天 。
而在“全球最强算力”加持之下,这个时间直接缩短到了1小时之内,整整提速了将近170倍!
超算|“全球最强智算”王座 刚刚易主:阿里一举击败谷歌
文章图片

智算,即为人工智能专门提供的AI算力 。这个“全球最强智算”的庐山真面目,正是来自位于河北省张北县的阿里云飞天智算平台所启用的张北智算中心 。
超算|“全球最强智算”王座 刚刚易主:阿里一举击败谷歌
文章图片

而且这个智算中心不仅是在AI算力上取得第一这么简单,据了解,这个智算中心还“解锁”了如下能力:
千卡并行效率达90%以上,计算资源利用率可提升3倍
最高可将存储IO性能提升10倍,将系统时延显著降低90%
最多可提升AI训练效率11倍,推理效率6倍
PUE最低降至1.09,建设占地面积节省90%
而且这些AI算力,正在带来一个更加智能化的日常 。
如此智算都用在了哪里?
首先就是刚才提到的自动驾驶 。
超算|“全球最强智算”王座 刚刚易主:阿里一举击败谷歌
文章图片

此前,阿里云便和小鹏汽车打造了中国最大的自动驾驶智算中心“扶摇” 。
而这也是国内第一个投入实际运营的,专为自动驾驶服务的超大智能算力集群 。
也正如其名,“扶摇”之意,是指阿里云提供的超大算力和AI研发工具链,能让小鹏汽车的自动驾驶技术的迭代效率“直上九天” 。
总体而言,“扶摇”具备两大特征 。
首先就是以超大规模GPU算力作为AI模型迭代的基础 。
这是因为自动驾驶、或者说智能汽车上的核心功能,其实都是AI,是大规模的深度学习算法 。
而无论是训练,还是测试这样的模型,扮演主角的不再是传统CPU的逻辑推理能力,而是以AI加速器为主的浮点计算能力,GPU则是当前AI加速器的主流 。
其次,便是提供了针对自动驾驶应用特征的计算集群、性能加速软件和AI大数据一体式平台,使得模型训练速度、GPU资源利用率和算法研发效能都大大提升 。
据了解,目前已经建成交付的扶摇智算中心,总算力达到600PFLOPS,即每秒进行6x1017次浮点运算 。
整体计算效率上,扶摇实现了算力的线性扩展 。存储吞吐比业界20GB/s的普遍水准提升了40倍,数据传输能力相当于从送快递的微型面包车,换成了20多米长的40吨集装箱重卡 。
这也就是自动驾驶核心模型训练时间,能够由7天缩短至1小时内的主要原因 。
而自动驾驶,只是飞天智算中心应用的场景之一 。
在科研领域,也早已处于“上岗”状态 。