自动驾驶|每秒浮点运算67亿亿次!毫末发布中国自动驾驶最大智算中心MANA OASIS( 三 )



(张凯宣布毫末正式打响“2023四大战役”)
“毫末始终认为 , 伟大的机遇要靠内在的实力去把握 , 在激烈市场竞争中取胜的关键 , 仍然是掌握核心技术 。 ”演讲中张凯强调了毫末在技术研发投入上的坚定决心 。 截止目前 , 毫末已获得专利证书146件 , 全面覆盖数据融合、智能感知、智能决策、控制执行、模型算力提升等领域 。 “未来 , 技术研发仍将是毫末投入的重中之重 。 ”

(张凯表示 , 技术研发是毫末未来发展重中之重)
中国自动驾驶最大智算中心MANA OASIS成立 , 毫末五大模型全新亮相升级第七届HAOMO AI DAY , 毫末智行宣布智算中心“雪湖·绿洲”(MANA OASIS)正式成立 。 MANA OASIS是中国自动驾驶行业最大智算中心 , 由毫末智行与火山引擎联合打造 , 每秒浮点运算达67亿亿次 , 存储带宽每秒2T , 通信带宽每秒800G 。

(顾维灏表示 , MANA OASIS将助力毫末冲刺进入自动驾驶3.0时代)
毫末智行CEO顾维灏表示 , “MANA OASIS让毫末拥有了超级计算能力 , 数据、算力充沛 , 毫末的技术产品能力将更加强大 。 在‘MANA OASIS’加持下 , 毫末将冲刺进入自动驾驶3.0时代 。 ”
火山引擎总裁谭待表示 , “我们很荣幸与毫末智行一道在智算中心领域达成深度合作 , 共同推动自动驾驶智能训练平台跨越式发展 , 加速自动驾驶技术敏捷迭代和商业化落地 。 ”

(毫末智行智算中心“雪湖·绿洲”每秒浮点运算达67亿亿次)
数据驱动是自动驾驶发展的方向与趋势 , 海量的产品数据、超大规模的数据训练、大模型的应用等 , 都对算力提出了更庞大的需求 。 基于火山引擎丰富的大数据积累和底层技术 , MANA OASIS实现的计算、存储、通讯能力 , 让数据更快速转化成知识 , 以实现将本增效的目的 。
在数据管理能力方面 , 为充分发挥智算中心价值 , 让GPU持续饱和运行 , 毫末历经两年研发 , 建立了全套面向大规模训练的Data Engine , 实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒 。 在算力优化方面 , 毫末与火山引擎合作 , 部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架 。 软硬一体 , 把算力优化到极致 。 在训练效率方面 , 基于Sparse MoE , 通过跨机共享 , 轻松完成千亿参数大模型训练 , 且百万个Clips(毫末视频最小标注单位)训练成本只需百卡周级别 , 训练成本降低100倍 。

(MANA OASIS基础能力展示)
在MANA OASIS的加持下 , 毫末MANA五大模型全新亮相升级 , 助力毫末自动驾驶高速发展:其中 , 视觉自监督大模型 , 让毫末在中国首个实现4D Clip的自动标注;3D重建大模型 , 助力毫末做数据生成 , 用更低成本解决数据分布问题 , 提升感知效果;多模态互监督大模型 , 则可以完成通用障碍物的识别;动态环境大模型则进一步使用重感知技术 , 降低对高精地图依赖;人驾自监督认知大模型让毫末的驾驶策略更加拟人化 , 安全及顺畅 。

(MANA五大大模型助力自动驾驶能力发展)
首先 , 视频自监督大模型 , 让毫末4D Clip标注实现100%自动化 , 人工标注成本降低98% 。 为了更低成本、更高效获取更多高价值数据 , 需要解决从离散帧自动化扩充到Clips形态的问题 。 毫末首先利用海量videoclip , 通过视频自监督方式 , 预训练出一个大模型 , 用少量人工标注好的Clip数据进行Finetune(微调) , 训练检测跟踪模型 , 使得模型具备自动标注的能力;然后 , 将已经标注好的千万级单帧数据所对应的原始视频提取出来组织成Clip , 其中10%是标注帧 , 90%是未标注帧 , 再将这些Clip输入到模型 , 完成对90%未标注帧的自动标注 , 进而实现所有单帧标注向Clip标注的100%的自动转化 , 同时降低98%的Clip标注成本 。 毫末视频自监督大模型的泛化性效果极佳 , 即使是在一些非常困难的场景 , 例如严重遮挡的骑行者 , 远处的小目标 , 恶劣的天气和光照 , 都能准确地完成自动标注 。