英伟达|NVIDIA要和Intel、AMD开战,欲扶持ARM对抗X86

英伟达|NVIDIA要和Intel、AMD开战,欲扶持ARM对抗X86


NVIDIA能不能收购ARM还是未知之数 , 不过其已经迫不及待利用ARM做抓手 , 来打击做x86 CPU的Intel和AMD了 。 在最新公开资料中 , NVIDIA晒出了配备ARM处理器(Ampere Altra)和A100 GPU加速卡的平台和x86处理器平台的性能差异 , 基于MLPerf最新的1.1基准 。

可以看到 , 在深度学习推荐模型DLRM、自然语言处理网络BERT、会议识别RNN-T、医学图像划分3D U-Net、图像分类的ResNet-50等负载中 , 与x86表现不相上下 , 甚至在3D U-Net单项中还实现反超 。 参与对比的还有高通AI100、Intel至强8380(Ice Lake)等 。
加速卡方面 , 如果以A30为标准 , 离线环境下 , A100在大多数工作负载下的处理速度都是A30的2倍左右;在服务器环境下 , 基于x86的A100对会议识别RNN-T的处理速度接近A30的3倍 。
据了解 , MLPerf是当前全球最具影响力的AI计算基准评测组织 , 由图灵奖得主大卫·帕特森(DavidPatterson)联合谷歌、斯坦福、哈佛大学等单位共同成立 , 每年组织全球AI训练和AI推理性能测试并发榜 。
此外 , NVIDIA下一代显卡RTX 40系列的频率将有所提升 。
【英伟达|NVIDIA要和Intel、AMD开战,欲扶持ARM对抗X86】AMD RDNA2架构的一大特点就是高能效、高频率 , RX 6000系列加速频率没有一个低于2.1GHz , RX 6700 XT甚至达到了2669MHz 。 NVIDIA Ampere的频率则低得多 , 加速最高也不到1.8GHz , 但是下一代Ada Lovelace将有所不同 。
据最新曝料 , Ada Lovelace架构大核心代号AD102 , 频率将不低于2.2GHz 。 曝料者没说是基准还是加速频率 , 但显然应该是后者 。 AD102核心预计有18432个流处理器 , 对比GA102核心增加超过70% , 理论上FP32浮点计算性能可达81TFlops , 对比RTX 3090 32TFlops增加足足1.25倍 。 事实上 , RTX 3090相比于RTX 2080 Ti的浮点计算性能就增加了1.5倍 , 但这只是理论性能 , 实际游戏性能提升幅度大约在50-60% 。 这么算下来 , AD102核心的游戏性能有望增加40%以上 , 依然很猛 。 另外 , AD102核心仍然坚持384-bit GDDR6X显存 , 暂时还没有GDDR7 。