芯片异构：竞争格局扑朔迷离( 二 ) 3月22日

英伟达发布了NVIDIANVLink-C2C互连技术，其链路的能效最多可比NVIDIA芯片上的PCIeGen5高出25倍，面积效率高出90倍，可实现每秒900GB乃至更高的一致互联带宽。也就是说，在异构集成的小芯片互连方面，英伟达也在做与英特尔类似的事情。
“除NVLink-C2C外，英伟达将支持UCIe标准。与NVIDIA芯片的定制芯片集成既可以使用UCIe标准，也可以使用NVLink-C2C 。 ”黄仁勋说。
对此有专家指出，这表明英伟达并没有想要游离在UCIe联盟之外，但也同时展现出了英伟达对NVLink-C2C的绝对信心，未来也许会组建自己的联盟。
赛迪顾问集成电路中心高级咨询顾问池宪念向《中国电子报》采访人员表示，英伟达自身拥有的NVIDIANVLink-C2C依托于NVIDIA世界一流的SERDES和LINK设计技术，可从PCB级集成和多芯片模组扩展到硅插入器和晶圆级连接。这可提供极高的带宽，同时优化能效和裸片面积效率。相较于UCIe标准， NVLink-C2C经过优化，延迟更低、带宽更高、能效更高。
苹果或许与英伟达有着同样的考虑。本月初， “跨界选手”苹果携地球最强桌面芯片M1Ultra抢别人“饭碗” ，产品性能超越一众CPU与GPU的专业选手。
芯谋研究分析师张先扬向采访人员表示， 2022年3月9日苹果公布的自研芯片M1Ultra是基于Chiplet工艺，该技术提供了2.5TB/s的超高带宽，远远领先于目前公布的UCIe1.0标准。也就是说，苹果的Chiplet产品路线通过与台积电的合作就可以完成，且领跑于当前UCIe标准，因此对苹果来说，加入该联盟不是必选项。
“异构”格局扑朔迷离
此前，全球异构计算领域一直维持在互相制衡的三国杀格局。但UCIe联盟的出现打破了原有的平衡，英特尔和AMD的亲密互动，英伟达的似离非离，让整个形势变得扑朔迷离。尽管合纵连横是上上之策，但打铁还需自身硬，想要在异构计算的壁垒中率先突围，实力才是硬道理，所以三巨头都在各自擅长的领域内大动干戈。

文章图片
“三巨头”分别都有自己主导的异构计算体系。池宪念介绍道，英特尔主导的异构计算体系主要为其自身系列产品和服务使用，在PC与高性能移动计算领域具有优势；以IBM、谷歌、英伟达为主的OpenPower联盟则以IBMPower芯片架构技术为基础，主要面向高性能计算领域应用；以AMD、高通、ARM、三星、北京华夏芯等为主体的HSA(heterogeneoussystemarchitecture ，异构计算系统)联盟，是完全开放的异构计算联盟， ARM、高通、三星等巨头参与其中，在高性能移动计算领域具有优势。
CPU龙头英特尔作为业界唯一拥有CPU、独立GPU、IPU、ASIC、FPGA、各种加速器的企业。在最近的投资者会议中提出了一个新架构-FalconShores ，计划于2024年完成，这是一款将X86和XeGPU整合到一个Xeon插槽中的新架构。
英特尔中国研究院院长宋继强向《中国电子报》采访人员表示，将X86的主芯片加上GPU的性能整合在一起，这是一个创新。在性能上， FalconShores将提供超过5倍的每瓦性能、超过5倍的计算密度以及超过5倍的内存容量和带宽。
在采访人员问到英特尔与其他几家相比有哪些优势时，宋继强指出，一是技术基础稳固且强大；二是英特尔能有架构和多种不同加速器去处理合适的应用负载；三是英特尔提出了“软件优先” 。这对开发者来说尤为重要。
GPU龙头英伟达在去年的GTC2021上公布了其专为人工智能和超算使用需求打造的GraceCPU系列产品，并且打造了全新的芯片路线“GPU+DPU+CPU” 。而在今年的GTC2022上，英伟达宣布推出首款面向AI基础设施和高性能计算的基于ArmNeoverse的数据中心专属CPU-“GraceCPU超级芯片” 。