显卡|RTX 4090突破100T浮点性能,游戏性能是3090的2倍以上

显卡|RTX 4090突破100T浮点性能,游戏性能是3090的2倍以上

文章图片

显卡|RTX 4090突破100T浮点性能,游戏性能是3090的2倍以上

文章图片


下代英伟达RTX 4090系列 , 由AD102驱动的显卡是突破100TFLOP浮点性能的游戏产品
英伟达RTX 3090 Ti提供所有游戏显卡中最高的计算性能 , FP32(单精度)显卡计算达到40到45TFLOPs之间的任何位置 。 但随着今年下半年下代显卡的问世 , 会有很大的提升
不仅英伟达的下代显卡 , 还有AMD的显卡 , 都能达到100TFLOPs 。 这标志着消费显卡市场的一个巨大里程碑 , 该市场无疑已经见证了当前这一代显卡的主要性能和功耗跃升 。 直接从275W限制到350-400W是标准 , RTX 3090 Ti之类的产品已经消耗了超过500W的功耗 。 下代更加耗电 , 但计算帧数有任何依那么要消耗这么多电力的一个原因

所以在一天结束时 , 一定电脑硬件 , 尤其是显卡 , 变得更加强 , 但很高兴看到所有这些能力都被充分使用来运行下代游戏 , 尤其是带有ray的8K游戏跟踪和未来的图形效果

AMD RX 7900 XT/7800 XT规格更新 , 核心更少但性能目标相同

AMD的RX 7000显卡的规格在流片之前的某个时间进行了更新 。 更高端的Navi3x核心在进入量产之前就进行了剪裁 , 为了避免浪费 。 借助RDNA3 , 工作组处理器(WGP) , 显卡上调度的基本单元已经过彻底改革 。 现在每个计算单元有四个32核SIMD , 每个CU总共有128个 , 每个WGP有256个

以前 , RX 7900 XT(Navi31)在两个相同的5nm裸片上共有15360个着色器 。 现在已经减少到12288个 , 分布在两个6144个核心小芯片上 。 AMD对6nm MCD进行了调整 , 且调整显存控制器比修改显卡核心要容易得多 。 仍在为Navi31寻找一个七模零件

Navi32也采用x25nm图形计算芯片(GCD)和46个6nmMCD的小芯片设计 。 早些时候 , 它配备10240个核心、192位总线和12GB GDDR6显存 。 预测已更新为8192个着色器 , 涵盖32个WGP、8个着色器阵列和4个着色器引擎
Navi33在16个WGP中使用4096个流处理器保持不变 。 包括IPC、计算和频率增益 , 它为RX 7700 XT提供超过2倍的性能提升 。 配备64128MB的三级缓存、128位总线和8GB GDDR6显存 。 Navi33核心的运行频率最高可达3GHz , AIB型号会更快
【显卡|RTX 4090突破100T浮点性能,游戏性能是3090的2倍以上】由于只有高端产品的核心数量有所减少 , 这与最佳可扩展性 。 与全脂15360核心芯片相比 , 使用12288核Navi31芯片会大致相同的性能水平 , 使用改进的睿频会更高 。 Navi32也是这样 。 Navi33保持不变 , 因为它在着色器强度方面已经受到限制 , 一开始