7月1日|英伟达再次霸榜mlperf
7月1日 , 当MLPerf发布了最新的1.0基准测试结果时 , 毫无悬念 , 英伟达再次霸榜 。
MLPerf由图灵奖得主大卫·帕特森(DavidPatterson)联合谷歌、斯坦福、哈佛大学等单位共同成立 , 每年MLPerf会定期进行AI训练和推理新测试 , 并添加代表AI最先进技术的新工作负载 。
在最新一轮的基准测试MLPerf1.0中 , MLPerfTrainingv1.0由八种不同的工作负载组成 , 涵盖广泛的应用场景 , 包括视觉、语言、推荐和强化学习 。
MLPerfInferencev1.0在七种不同类型的神经网络中测试了七种不同的负载 , 其中三个用于计算机视觉 , 一个用于推荐系统 , 两个用于语言处理 , 一个用于医学成像 。
文章图片
这是英伟达生态系统第四次参加MLPerf的训练测试 , 除英伟达之外 , 戴尔、富士通、技嘉、浪潮、联想、宁畅、超微一起参与了本轮测试 , 使用NVIDIAA100TensorCoreGPU , 推出12套商用系统 , 占所有提交作品的四分之三 。
重点是 , 唯一进行了全部8项测试的只有英伟达及其合作伙伴 。
文章图片
更快更聪明打破八项基准测试记录
【7月1日|英伟达再次霸榜mlperf】MLPerf1.0基准测试基于当今最常用的AI工作负载和场景 , 与之前相比 , 增加了会议识别RNN-T和医学图像划分UNet-3D两种 。 其余六种是自然语言处理网络BERT、深度学习推荐模型DLRM、对象检测网络SSD和MaskR-CNN、强化学习网络MiniGo和用于图像分类的ResNet-50 。
文章图片
在这八项测试中 , A100GPU均创纪录 。 英伟达数据中心计算产品管理高级总监PareshKharya分享了DGXSuperPOD和DGXA100在测试中的表现 。
训练基准测试聚焦用户最关心的问题 , 比如训练一个全新AI模型所需的时间 , 在最新一轮MLPerf基准测试结果中 , 每一项模型训练中英伟达AI平台都可在最短的时间内完成 , 并在商用提交类别的所有八项基准测试中创下了性能纪录 。
文章图片
基于NVIDIADGXSuperPOD的Selene在所有八项测试中均创下纪录
可以看出 , 这次测试是英伟达在Selene进行的大规模测试 。
从最新的TOP500排名来看 , Selene是世界上最快的商业人工智能超级计算机之一 , Selene是英伟达6位工程师仅花费约25天即搭建完成的 , 传统超算系统在最理想情况下也需要数十名工程师花费数月时间完成 , 可以说实现了一个不小的工程奇迹 , 这与NVIDIADGXSuperPOD架构超强的高可扩展的模块化设计特点分不开 。
此外 , 在网络互连结构方面 , Selene采用了200GHDR的InfiniBand技术 , 同时将280个节点采用胖树拓扑互连 , 结合NVIDIA最新的节点间通信加速技术SHARPTM2.0 , 让Selene能够在保障足够网络带宽的同时 , 降低节点间通信延时 , 提高大规模运算处理效率 。
文章图片
A100GPU在商用系统类别的所有八项测试中均创下纪录
而对于需要最高性能的大规模工作 , 这恰恰是英伟达的优势所在 , 英伟达创纪录地调集连接了4096个GPU的资源 , 英伟达及其合作伙伴在八项精准测试中都创下纪录 。
左右手协同软硬全栈并进
MLPerf测试结果再次展示了英伟达作为技术新贵的优势 , 在过去两年半的时间内 , 英伟达将性能提高了多达6.5倍 , 充分证明了包括GPU、系统和软件在内的全栈式NVIDIA平台的实力 。
- 百度|传英伟达加大GeForce RTX 3050供应力度,大量供货将在春节后到来
- 400亿芯片交易接近尾声,英伟达、ARM表明态度,禁止收购后
- 军工|中国版“英伟达”诞生,核心技术完全自研,国产替代即将崛起
- 去年7月底|日产全新奇骏销量暴跌2808辆中国消费者未必买账
- 英伟达 RTX 3090 Ti 经销商定价曝光,约 2.2 万元起
- 英伟达|被称“中国版英伟达”,核心技术100%自研,年收入大涨超65%
- 英伟达发布12G显存版3080!AI超级分辨率:1080p帧数、4K画质
- 英伟达|NVIDIA晒《黑客帝国4》定制版3080 Ti:中国限量仅此一块
- 飞利浦·斯塔克|原价买显卡时代即将来临!英伟达:今年火力全开加大显卡产能
- 安卓|400亿芯片交易接近尾声,英伟达、ARM表明态度,禁止收购后果严重