CPU|决定处理器性能表现的奥秘,你真的了解吗?


英特尔在2020年9月正式发布了代号为TigerLake的第11代酷睿处理器 , 这代产品由内而外进行了全面升级 , 提供性能强劲的IrisXe核芯显卡、独立AI计算单元、全新多媒体引擎、PCIe4.0控制器 , 以及对Thunderbolt4的支持等 , 可谓是亮点颇多 。 而具体到处理器的计算核心部分 , TigerLake则采用全新设计的微架构 , 辅以高频率加持 , 性能提升同样非常显著 , 下面就让我们就来具体谈谈 。
全新架构与改进工艺带来的高频率
此前英特尔提出了一个公式 , 那就是:IPC×频率=处理器的性能表现 , IPC即“每时钟周期指令数” , 用通俗点的话来说就是“同频性能” , 而决定同频性能的基础就是处理器的微架构设计 。
英特尔在2018年举办架构日 , 当时宣布的微架构路线图
而说到微架构 , 英特尔在2019年将首批10nm产品IceLake推向市场 , 处理器核心部分IceLake采用了全新设计的SunnyCove微架构 , 相比于传统的Skylake微架构进行了全面增强 , 拥有更深的流水线、更大的缓冲区、更多的执行单元 , 以及更先进的指令集支持 , 平均IPC提升高达18%;所以即便受限于初代10nm频率较低的影响 , 搭载SunnyCove微架构的IceLake产品性能依旧不差 。 但是 , 很多用户对英特尔初代10nm频率较低的表现耿耿于怀 , 也有很多消费者期待着早日拥有一个同时满足高频+高IPC的产品 。
SunnyCove对比Skylake在IPC方面提升显著 , 最高达到40% , 平均也有18%
为了提高频率 , 英特尔在10nm工艺的基础上持续改进 , 将增强型FinFET晶体、SuperMIM(金属-绝缘体-金属)电容器相结合 , 打造出全新的10nmSuperFin工艺 , 实现了大幅度的节点内性能提升 , 甚至官方表示性能提升幅度堪比完整的工艺节点转换 。 具体体现到市场中 , 第11代酷睿TigerLake中的旗舰产品——酷睿i7-1185G7可实现4.8GHz单核心睿频 , 4.3GHz全核心睿频 , 相比酷睿i7-1065G7提高了接近1GHz!主流产品——酷睿i5-1135G7也可实现单核心4.2GHz睿频 , 全核心3.8GHz睿频 , 比上代的旗舰酷睿i7-1065G7也要全面高出一大截 。
【CPU|决定处理器性能表现的奥秘,你真的了解吗?】10nmSuperFin工艺的改进
而在微架构方面 , 英特尔也并没有停下脚步 , 在基于SunnyCove微架构的基础上继续增强 , 推出了经过全面改良的WillowCove微架构 , 优化了晶体管设计 , 支持Control-flowEnforcementTechnology/CET技术提升安全性 , 改进缓存结构并大幅度增加缓存容量 , 最终WillowCove微架构的每核心二级缓存高达1.25MB、每核心三级缓存高达3MB 。
在SunnyCove的基础上 , WillowCove经过改进 , 做到了继续增强
最终 , TigerLake搭载了比SunnyCove微架构更加强大的WillowCove微架构 , 并在10nmSuperFin工艺的加持下大幅提高频率 , 同时满足了高频率+高IPC两个特点 , 这让此前的轻薄本处理器无法比拟 。
SunnyCove与WillowCove频率/电压曲线 , WillowCove最高睿频更高 , 同频电压则更低
新架构的超强性能表现
目前AIDA64已经可以全面检测出TigerLake系列产品的参数信息 。 我们使用全新的宏碁非凡S3X作为平台进行测试 , 这款产品搭载酷睿i7-1165G7处理器(单核睿频4.7GHz、全核睿频4.1GHz、12MB三级缓存、5MB二级缓存) , 配备双通道LPDDR4X4267内存 , PL1设定40W、PL2设定64W(实际散热能力可支持单烤FPU长期稳定在30W) , 性能释放比较激进 。
y-cruncher是计算圆周率等数学常数的软件 , 创造了计算圆周率的世界纪录 , 对新处理器和新指令集的优化较快 。 由于TigerLake搭载的WillowCove微架构对AVX-512指令集有着全面的支持 , 因此在这项测试中表现极其出色 , 计算10亿位圆周率花费时间仅为58.217秒 , 甚至做到了“以小博大” , 比8核心16线程的标压处理器还要快出不少!可见新架构所带来的强大效能 。