Windows|NV新一代GPU架构图曝光:RTX 4090性能翻番无压力

Windows|NV新一代GPU架构图曝光:RTX 4090性能翻番无压力

文章图片

Windows|NV新一代GPU架构图曝光:RTX 4090性能翻番无压力

5月24日上午11点 , NVIDIA将亮相台北电脑展举办专题演讲 , 虽然老黄缺席 , 但GeForce业务高级副总裁在列 , 还是有希望公布RTX 40系显卡的消息甚至是提前发布 。

在此之前 , 爆料达人Kopte7kimi分享了号称是AD102 GPU的内核设计图 。
AD102也就是Ada Lovelace家族的次顶配核心 , 也是RTX 40系游戏旗舰卡的配置 , 大概率对应RTX 4090 Ti、RTX 4090显卡 。

分析来看 , AD102内建多大12组GPC(显示计算簇) , 比上代GA102多出70% 。 每组GPC包括6个TPC(2个SM) , 每个SM单元包括4个子核心 , 这都与安培相同 , 但不同的是 , 每个SM子核心包含128组FP32单元 , 加上IN32整数单元合计达到192 。
完整AD102包括24组SM , 所有就是12288个FP32单元加上6144 INT32 , 说通俗易懂点就是18432个CUDA 。
缓存方面 , AD102核心中 , 每组SM享有192KB L1 , 比安培增加50% , 共计4.5MB 。 L2增加到96MB , 是安培的16倍 。

相应的 , ROP和RT光追单元规模自然也是水涨船高 , AD102最多384个ROP , RTX 3090 Ti不过112个 。 另外 , 光追单元升级到第三代 , Tensor单元升级到第四代 。
【Windows|NV新一代GPU架构图曝光:RTX 4090性能翻番无压力】基于此 , RTX 4090最终实现性能翻番似乎并不是可望不可及的虚妄 , 就FP32单精度浮点来说 , 外界预期能到90T , 而RTX 3090 Ti不过40T , 代价就是超600W的功耗……