自动驾驶|毫末智算中心:补齐自动驾驶3.0时代最后一块拼图

自动驾驶|毫末智算中心:补齐自动驾驶3.0时代最后一块拼图

文章图片

自动驾驶|毫末智算中心:补齐自动驾驶3.0时代最后一块拼图

文章图片

自动驾驶|毫末智算中心:补齐自动驾驶3.0时代最后一块拼图

文章图片

自动驾驶|毫末智算中心:补齐自动驾驶3.0时代最后一块拼图

文章图片

自动驾驶|毫末智算中心:补齐自动驾驶3.0时代最后一块拼图

文章图片

自动驾驶|毫末智算中心:补齐自动驾驶3.0时代最后一块拼图

文章图片

1月5日 , 在毫末智行第七届AI DAY上 。 毫末发布了“雪湖·绿洲”(MANA OASIS) 。
超算一般指科学计算 , 智算一般指人工智能计算 。 毫末智算中心 , 采用私有的云服务 , 而且是专门符合自动驾驶需求的云服务 。 自建云服务耗资巨大 , 绝大多数选手都在公有云上存储数据 , 极少数互联网巨头自建云服务 。

除了毫末智行 , 2022年 , 特斯拉、小鹏也宣布自建超算中心 , 华为早已搭建了昇腾云平台 , 相当于华为的超算中心 。
自动驾驶企业为什么要自建超算中心?毫末智行的MANA OASIS战斗力几何?它能给毫末带来什么?能给消费者带来什么?
电驹哥采访到了毫末智行 , 得到了如下答案:
MANA OASIS的含金量
毫末智行的智算中心取名为“雪湖·绿洲” , 英文MANA OASIS 。 毫末解释说:毫末数据智能系统MANA的中文名字是雪湖 , 绿洲从雪湖孕育而来 , 支撑毫末的自动驾驶能力进一步升级 。
MANA OASIS的浮点运算可以达到每秒67亿亿次 , 存储带宽达到每秒2T , 通信带宽方面达到每秒800G 。

官方表示:这是中国自动驾驶业内算力最大的智算平台 。 作为对比 , 之前小鹏在内蒙古自建的超算中心 , 算力是60亿亿次每秒 。
这些数据代表了什么?
MANA OASIS与普通的云服务有所不同 , 它是专门根据自动驾驶3.0时代需求设计的 。 按照毫末智行CEO顾维灏的介绍 , 自动驾驶对智算中心有六个独特要求:
1、算力要大 。 浮点算力67亿亿次每秒这个数据 , 代表着能做什么大模型 , 能做多少大模型 , 能够允许多少个AI工程师在这个“练武场”中进行训练 。
2、小文件存储效率 。 自动驾驶的数据是片段式的 , 最大特点是小文件多 , 达到百亿个 。 对这些小文件随机存储的效率 , 代表着训练效率 。
3、存储带宽 。 自动驾驶的大模型训练需要交换的数据多 , 要求有高性能的存储带宽 , 这样 , 大量数据才能在大模型中顺畅流动 。
4、通讯带宽 。 所有的计算能力目前还不能在单台服务器中完成 , 需要多台服务器协同工作 , 这就要求了集群的通讯带宽 。
5、自动驾驶需要的模型 , 例如transformer模型 , 当变得很大时 , 就会稀疏 。 要求智算中心有更好的并行计算框架 , 在训练时能把硬件资源都利用起来 。
6、兼容性 。 人工智能发展很快 , 新的算法层出不穷 , 要求智算中心能够尽快引入新的技术和新的模型 。
根据这六个要求 , 毫末和火山引擎共同定制了这个属于自动驾驶的智算中心 。 这些数据也代表了毫末智行在自动驾驶领域的水平和未来的发展潜力 。
MANA OASIS的架构
MANA OASIS的系统框架包括两个:超高速并行的毫末文件系统和GPU超算 。 其中 , GPU超算第一期有超过2千张卡 , 采用双向Switch连接 , 具有超宽低时延网络架构 。