芯片异构:竞争格局扑朔迷离( 二 )


英伟达发布了NVIDIANVLink-C2C互连技术 , 其链路的能效最多可比NVIDIA芯片上的PCIeGen5高出25倍 , 面积效率高出90倍 , 可实现每秒900GB乃至更高的一致互联带宽 。 也就是说 , 在异构集成的小芯片互连方面 , 英伟达也在做与英特尔类似的事情 。
“除NVLink-C2C外 , 英伟达将支持UCIe标准 。 与NVIDIA芯片的定制芯片集成既可以使用UCIe标准 , 也可以使用NVLink-C2C 。 ”黄仁勋说 。
对此有专家指出 , 这表明英伟达并没有想要游离在UCIe联盟之外 , 但也同时展现出了英伟达对NVLink-C2C的绝对信心 , 未来也许会组建自己的联盟 。
赛迪顾问集成电路中心高级咨询顾问池宪念向《中国电子报》采访人员表示 , 英伟达自身拥有的NVIDIANVLink-C2C依托于NVIDIA世界一流的SERDES和LINK设计技术 , 可从PCB级集成和多芯片模组扩展到硅插入器和晶圆级连接 。 这可提供极高的带宽 , 同时优化能效和裸片面积效率 。 相较于UCIe标准 , NVLink-C2C经过优化 , 延迟更低、带宽更高、能效更高 。
苹果或许与英伟达有着同样的考虑 。 本月初 , “跨界选手”苹果携地球最强桌面芯片M1Ultra抢别人“饭碗” , 产品性能超越一众CPU与GPU的专业选手 。
芯谋研究分析师张先扬向采访人员表示 , 2022年3月9日苹果公布的自研芯片M1Ultra是基于Chiplet工艺 , 该技术提供了2.5TB/s的超高带宽 , 远远领先于目前公布的UCIe1.0标准 。 也就是说 , 苹果的Chiplet产品路线通过与台积电的合作就可以完成 , 且领跑于当前UCIe标准 , 因此对苹果来说 , 加入该联盟不是必选项 。
“异构”格局扑朔迷离
此前 , 全球异构计算领域一直维持在互相制衡的三国杀格局 。 但UCIe联盟的出现打破了原有的平衡 , 英特尔和AMD的亲密互动 , 英伟达的似离非离 , 让整个形势变得扑朔迷离 。 尽管合纵连横是上上之策 , 但打铁还需自身硬 , 想要在异构计算的壁垒中率先突围 , 实力才是硬道理 , 所以三巨头都在各自擅长的领域内大动干戈 。
芯片异构:竞争格局扑朔迷离
文章图片
“三巨头”分别都有自己主导的异构计算体系 。 池宪念介绍道 , 英特尔主导的异构计算体系主要为其自身系列产品和服务使用 , 在PC与高性能移动计算领域具有优势;以IBM、谷歌、英伟达为主的OpenPower联盟则以IBMPower芯片架构技术为基础 , 主要面向高性能计算领域应用;以AMD、高通、ARM、三星、北京华夏芯等为主体的HSA(heterogeneoussystemarchitecture , 异构计算系统)联盟 , 是完全开放的异构计算联盟 , ARM、高通、三星等巨头参与其中 , 在高性能移动计算领域具有优势 。
CPU龙头英特尔作为业界唯一拥有CPU、独立GPU、IPU、ASIC、FPGA、各种加速器的企业 。 在最近的投资者会议中提出了一个新架构-FalconShores , 计划于2024年完成 , 这是一款将X86和XeGPU整合到一个Xeon插槽中的新架构 。
英特尔中国研究院院长宋继强向《中国电子报》采访人员表示 , 将X86的主芯片加上GPU的性能整合在一起 , 这是一个创新 。 在性能上 , FalconShores将提供超过5倍的每瓦性能、超过5倍的计算密度以及超过5倍的内存容量和带宽 。
在采访人员问到英特尔与其他几家相比有哪些优势时 , 宋继强指出 , 一是技术基础稳固且强大;二是英特尔能有架构和多种不同加速器去处理合适的应用负载;三是英特尔提出了“软件优先” 。 这对开发者来说尤为重要 。
GPU龙头英伟达在去年的GTC2021上公布了其专为人工智能和超算使用需求打造的GraceCPU系列产品 , 并且打造了全新的芯片路线“GPU+DPU+CPU” 。 而在今年的GTC2022上 , 英伟达宣布推出首款面向AI基础设施和高性能计算的基于ArmNeoverse的数据中心专属CPU-“GraceCPU超级芯片” 。