未来十年架构创新的“灯塔”,英特尔揭开XPU的第二篇章( 二 )


具体的创新点在哪里呢?
未来十年架构创新的“灯塔”,英特尔揭开XPU的第二篇章
文章图片
按照英特尔的介绍 , 能效核是一个高度可扩展的x86微架构 , 它能满足客户从低功耗移动应用到多核微服务的全方位计算需求 。 对比英特尔迄今为止最多产的CPU微架构——Skylake , 能效核可在相同功耗下提升40%的单线程性能 , 或者在提供相同性能时 , 功耗仅为Skylake的40%不到 。 可想而知 , 如此出色的能效提升如果体现在计算集群当中 , 带来的价值将会是何等惊人 。
而性能核 , 不仅是英特尔迄今为止性能最高的CPU内核 , 而且在CPU架构方面也实现了阶梯式提升 , 可推动未来十年的计算发展 。 它是一个更宽、更深、更智能的架构 , 可提高执行并行性 , 降低时延 , 提升通用性能 。 值得一提的是 , 针对数据中心和机器学习场景 , 性能核还提供了更多专用硬件或者说加速器 , 例如新的英特尔高级矩阵扩展(AMX)来执行矩阵乘法运算 , 以获得显著的性能提升 , 如将AIINT8处理性能提升至现在的约8倍 。
未来十年架构创新的“灯塔”,英特尔揭开XPU的第二篇章
文章图片
将能效核与性能核联接起来的 , 是英特尔硬件线程调度器 , 它能与操作系统无缝配合 , 在合适的时机把合适的线程分配给合适的内核 。
这有点像我们熟知的“混合动力”汽车 , 通过油和电的混合驱动 , 让同样的一箱油 , 跑出最长的距离 。
这套运行逻辑也让我想到了“平衡术”理论 。
处理器的性能和功耗原本在天平的两端 , 性能的提升总是会带来更高的功耗 , 这是一件过去十几年都极难平衡的事 , 而英特尔的混合架构 , 用硬件线程调度器作为一个支点 , 将更高性能和更高能效置于不同的“核” , 做到了更优的性能平衡 。
IPU:释放CPU的内核
面对全球汹涌而来的数字化浪潮 , 大量新兴的云应用驱动了数据中心的快速发展 , 英特尔必须要从数据中心架构为起始点 , 为数字化和智能化转型提供“算力之源” 。
过去CPU是英特尔的战略核心 , 所有的设计都是让越来越多的处理通过CPU来解决 , 如今英特尔则变得更为灵活 , 有选择地将一些功能从CPU当中分离出去 , 用更“对路”的芯片来承接和处理 , 这其实能够更灵活地为客户提供更为敏捷的价值 , 这也是英特尔强调XPU战略的原因 。
比如IPU的发布 。
未来十年架构创新的“灯塔”,英特尔揭开XPU的第二篇章
文章图片
我们知道 , 服务提供商和企业正大量投资于超大规模数据中心 , 以便为云原生应用和微服务提供高效的计算 。 提供这些服务的应用程序必须能够访问高速、低延迟的存储和更快和更安全的网络基础设施 。 但是 , 虚拟交换、安全和存储等基础设施相关的应用和服务可能会占用大量CPU资源 。
从架构创新的角度 , 企业需求要一个专门的处理器 , 来加速这些基础设施服务 , 并通过把它们从CPU上卸载下来 , 来释放CPU的算力 , 用在更适于它的应用场景和负载中 。 这正是英特尔推出基础设施处理器(IPU)的初衷 。
简单地说 , IPU是一种可编程的网络设备 , 旨在使云和通信服务提供商减少在CPU中的额外性能开销 , 从而充分释放其性能价值 。
英特尔数据平台事业部首席技术官GuidoAppenzeller表示 , 基于IPU的架构存在几个优势:
第一 , 基础设施功能和客户工作负载的强分离使客户能够完全控制CPU;
第二 , 云运营商可将基础设施类的任务卸载到IPU上 , 更大化提升CPU利用率和收益;
第三 , IPU可管理存储流量 , 减少时延 , 同时通过无磁盘服务器架构有效利用存储容量 。 借助IPU , 客户可以通过一个安全、可编程、稳定的解决方案更好地利用资源 , 使其能够更好地实现计算与存储的平衡 。