重振半导体领导者荣光:解读英特尔2021架构日( 三 )
文章图片
除了12代酷睿处理器之外 , 英特尔也在2021架构日上介绍了DG2架构GPU , 当然现在英特尔将采用该架构的显卡称之为IntelArc显卡 , 中文名为英特尔锐炫 。 与DG1相比 , 英特尔锐炫显卡专门为游戏发烧友打造 , 预计第一批产品将会在2022年第一季度和大家正式见面 , 届时除了NV和AMD之外 , 游戏显卡终于来了第三位选手 。
文章图片
英特尔在过去推出的各类GPU中 , 都采用了“执行单元” , 而到了DG2架构中 , 则变成了全新的Xe内核 , 从命名就可以看到 , 英特尔对Xe架构显卡进行了重新设计 。 从架构图来看 , DG2显卡类似于NVIDIA的显卡 , 每个Xe内核中 , 包含着16个矢量引擎 , 以及16个矩阵数学引擎 , 这些引擎用来进行FP32、FP16以及INT8的计算 , 也就是传统的单精度以及AI计算 。 除了Xe内核之外 , Intel也介绍了图形单元簇 , 将其称之为渲染切片 , 这是专门为图形处理所搭载的架构 , 包括四个Xe内核以及为3D渲染所打造的计算单元 , 比如说光追单元 , 纹理单元、几何前端 , 能够支持DX12U的各种特征以及实时光线追踪 , 同时也将支持类似于DLSS的XeSS功能 。
XeSS使用深度学习来合成非常接近原生高分辨率渲染质量的图像 , 在实际演示中 , 基于XeSS技术的虚幻5引擎的4K渲染图像与原生4K相比几乎不变 , 体现在游戏上就是帧率的增加 。
文章图片
文章图片
而在纯算力上 , Intel锐炫显卡的频率提升幅度为50% , 而且每瓦性能提升幅度也达到了50% , 从而带来更高的算力 。 为了让英特尔的这款显卡能够发挥最出色的性能 , 英特尔也选择了台积电的6nm工艺 , 同时在驱动程序上 , 英特尔也和诸多游戏开发者一起 , 对Xe架构进行不断地优化 , 目前该项工作已经有了初步的成效 , 在密集型图形游戏之中 , 吞吐量提升15% , 最高可以达到80% , 从而让游戏加载时间降低了25% 。 当然距离显卡的正式发布还有近半年的时间 , 未来英特尔也将不断地对显卡进行改良 , 让其更加符合游戏玩家的期盼 。
当然除了这两个大家最为关注的硬件之外 , 英特尔也在本次架构会上介绍了面向数据中心的SapphireRapids至强处理器与面向超算的XeHPC和PonteVecchio 。 其中SapphireRapids基于Intel7制程工艺技术 , 支持加速器接口架构指令集、高级矩阵扩展 , 以及数据流加速器 , 能够提供更高的整体工作负载性能 , 在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据 。 当然作为面向数据中心的新一代处理器 , SapphireRapids通过先进的内存和下一代I/O , 包括PCIe5.0、CXL1.1、DDR5和HBM技术 , 来推动行业技术转型 。
文章图片
英特尔在之前表示Xe架构的GPU是一个大家族 , 除了面向发烧级玩家的Arc显卡之外 , 也有针对超算推出的采用XeHPC架构的PonteVecchio 。 PonteVecchio由多个复杂的单元构成 , 通过嵌入式多芯片互连桥接进行封装 , 实现了设备之间的低功耗与高速的连接 。
文章图片
文章图片
英特尔表示在PonteVecchio中 , 每一个单元均有8个Xe内核 , 提供4MB的一级缓存 , 基于台积电最先进的5nm制程工艺 , 目前PonteVecchio芯片还处于早期的A0阶段 , 不过先进的工艺以及豪华的参数已经可以让其实现45T的FP32吞吐量 , 内存带宽达到了5TBps , 连接带宽也达到了2TBps , 英特尔称通过训练 , 目前A0芯片已经可以实现每秒43000张图像的识别 , 达到了行业领先的水准 。 毫无疑问PonteVecchio的出现让NVIDIATesla计算卡面临巨大的挑战 , 同时也可以让整个超算行业得到进一步的发展 。
- 中国半导体产业进入了技术驱动成长期 半导体及元件板块短线拉升|板块异动 | 拉升
- 芯片|半导体行业大赚!2021年第一季度19家企业宣布涨价
- 巴黎协定|纳微半导体成立全球首家电动车氮化镓功率芯片设计中心
- 半导体|晶闸管是什么? 四种常见晶闸管类型介绍
- 张汝京再出发,事关芯片制造设备,国产半导体能否迎来转机?
- 半导体|传英特尔(INTC.US)美国新芯片工厂选址俄亥俄州 拟投资200亿美元
- 伊隆·马斯克|马斯克给年轻人的建议:不要为了成为领导者,而试图成为领导者!
- 中芯国际|2021年中国半导体产业链新进程
- 华虹半导体(01347)涨超5% 台积电业绩超预期,机构建议关注半导体代工及设备机会|港股异动 | 港股
- 量子|「央广网-安徽频道」我国实现硅基半导体自旋量子比特的超快操控