中国工程院院士王恩东:瞭望 | 数据中心( 二 )


此外,进入智慧时代,企业普遍希望采用具有公共基础设施意义的人工智能算力基础设施。根据IDC调研,超过九成的企业正在使用或计划在三年内使用人工智能,其中74.5%的企业期望在未来可以采用具备公用设施意义的人工智能新型基础设施,这同样加剧了算力短缺。
智算中心将成为未来计算力的主要生产中心
《瞭望》:如何加速计算到智算转型?
王恩东:面对算力供给“鸿沟”,计算技术与产业需要构建一个新的发展格局,简单概括起来可以描述为:要通过多元算力融合和算力供给基建化加速计算到智算转型。
智能计算是借助自然界,特别是生物界规律的启示,设计出求解问题的算法。例如人工智能神经网络模仿人脑的生理结构和信息处理过程,模拟人类智慧。智能计算有着传统计算无法比拟的优越性,其最大特点就是不需要对问题自身建立精确的数学模型,非常适合于那些由于难以建立有效的形式化模型因而无法用传统数值计算方法解决的问题。
运行智能计算的有各种人工智能专用芯片和加速卡。数据显示,2020年,全世界以GPU为代表的AI加速芯片所交付的计算力总和已经超过了通用CPU,预计到2025年,AI加速芯片所提供的计算力可能超过全球算力总量的80%。智算将是智慧时代计算的主要形态,我们要加速这一转型进程。
加速计算到智算转型,多元算力融合是关键。进入智慧时代,算力多元化发展趋势愈加明显,主要体现在计算场景和计算架构的复杂多元。多架构引发了无法兼容、效率不高等问题。我们需要打破传统体系结构设计,创新智算体系结构,实现算力高效聚合和按需定义。
在体系结构方面,我们在2014年提出融合架构以及三步走技术路线,指明了数据中心体系结构的发展方向。目前已经从1.0走到2.0,实现了存储资源和FPGA、GPU、XPU加速设备池化,正逐步进入3.0阶段,提供更高效、灵活、智能的体系架构。在融合架构3.0阶段,可以通过芯片内大容量缓存、芯片外高带宽内存等存算一体方式实现计算数据结合,突破内存提供数据速度远远落后芯片处理数据速度的存储墙难题,加速数据在内存与芯片之间的搬运效率;通过高速互联交换网络,支持更广泛的CPU、GPU、FPGA等多元异构计算、支持新型存储资源池化,提高性能、降低能耗,实现更大规模资源可扩展,并进一步通过在互联处理单元中卸载控制平面,实现控制计算分离,进而达到更为灵活的资源可重构,提高算力供给的效率、灵活性。
《瞭望》:该怎样推动算力供给基建化?
王恩东:未来,人工智能对计算的需求将占全球计算需求的80%以上,而承载这种需求的就是AI算力中心,即智能计算中心,也叫智算中心。
根据2020年底国家信息中心信息化和产业发展部联合浪潮发布的《智能计算中心规划建设指南》的定义,智算中心是基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施,通过算力的生产、聚合、调度和释放,高效支撑数据开放共享、智能生态建设、产业创新聚集,有力促进AI产业化、产业AI化及政府治理智能化。
2020年4月,国家发改委明确新型基础设施建设的范围包含以数据中心、智能计算中心为代表的算力基础设施,算力供给基建化已成为趋势。可以预见,在加快推进新基建背景下,智算中心将成为未来计算力的主要生产中心、供应中心,也将成为推动经济社会运行的重要基础设施。
【 中国工程院院士王恩东:瞭望 | 数据中心】现在我们要加快推动算力供给基建化。建设智算中心必须满足三个要求:一是开放标准。要求智算中心从硬件到软件、从芯片到架构、从建设模式到应用服务都应该是开放的、标准的;二是集约高效。要求智算中心的建设要有超大规模,要采用领先技术,保证自身先进性;三是普适普惠。要求智算中心发挥基础设施的社会价值,服务大众。