马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机

贾浩楠韦丽雪褚万博发自副驾寺智能车参考报道|公众号AI4Auto
全球最快的AI训练速度王座 , 刚刚易主了 。
不是英伟达GPU , 也不是谷歌TPU……
马斯克治下的特斯拉 , 自研AI训练芯片D1 , 自研AI超级计算机DojoExaPod , 首秀即巅峰 , 登场就是全球第一 。
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
此外 , 马斯克还带来了另一个特斯拉新品:
汽车机器人 , 搭载了特斯拉包含芯片在内的软硬件系统 , 但跟百度的不同 , 不像汽车更像人 。
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
这就是特斯拉年度AI开放日上 , 马斯克再次带来的一系列激动人心的大进展 。
特斯拉自研AI训练芯片D1发布
马斯克说:要有一个超快的计算机来训练AutoPilot在内的整个自动驾驶系统 。
于是DOJO诞生了 。
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
DOJO , 取名源自日语里“练武”专用的道场 , 顾名思义 , DOJO就是特斯拉AI不断精益功夫的道场 。
DOJO是一种通过网络结构连接的分布式计算架构 。 它还具有大型计算平面、极高带宽和低延迟 , 以及分区和映射的大型网络 。
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
实际上 , 在CVPR2021现场 , 特斯拉就已经剧透过DOJO的相关性能 。
当时总算力达1.8EFLOPS , 读写速度高达1.6TBps , 一度被认为超越全球排名第一的超级计算机富岳 , 创造超算新纪录 。
但那时DOJO用的是英伟达的A100GPU , 单卡算力321TFLOPS , 共计5760张 , 节点数高达720个 。
而现在 , DOJO更进一步 , 自研了“心脏”芯片 。
特斯拉首款AI训练芯片D1 , 正式发布 。
7nm工艺 , 单片FP32达到算力22.6TOPs , BF16算力362TOPs 。
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
特斯拉发布会现场 , 还用图展示性能 , 拳打英伟达GPU , 脚踢谷歌TPU 。
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
一句话概括 , 比现在市面上任何芯片都强 。
特斯拉也用“PureLearningMachine” , 纯学习机器 , 来称呼D1芯片 。
此外 , D1芯片强的不只是单兵作战能力 , 还有集团军作战能力 , 它们可以无缝融合 , 变成超大规模计算阵列 。
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
能有多大 , 接下来 , 特斯拉就揭晓了之前预热海报上的“神秘物种”:
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
集合了25块D1芯片的训练模块!
这也是特斯拉首个训练模块 , 而把多个模块集合 , 就能形成更大算力的训练阵列:
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
至此 , 特斯拉自研超算DOJO完整真身亮相!
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机
文章图片
超过50万个训练节点 。 每个模块算力为9petaflops , 带宽为36TB/s 。
DOJO的可怕之处在于 , 不同于世界其他超算需要承担多种不同任务 , DOJO的唯一使命就是AI训练 , 或者可以说聚焦到自动驾驶算法的训练 。
因为专注 , 所以首秀即巅峰 。
AutoPilot、FSD , 特斯拉的其他AI训练任务 , 都能在DOJO里更高效练就 。
另外 , 特斯拉官方还继续剧透:这不是终点 , 下一代DOJO还会有10倍性能的提升!
马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机