算力|智算中心建设的“暗礁”与“灯塔”

算力|智算中心建设的“暗礁”与“灯塔”
文章插图

作者 | 维克多

是时候让智算中心“普惠自由”了
一家公司的办公室有电力供应,这能给这家公司带来区别于竞争对手的竞争优势吗?
答案不言自明。
【 算力|智算中心建设的“暗礁”与“灯塔”】现在人工智能(AI)技术与公司竞争优势的关系正类似于电力之于公司。一百多年来,电力曾给各个产业赋能,AI也同样可以给各个产业赋能。
从国家的层面来看,顶层设计似乎早已看到了这种趋势,“新基建”一词在把AI看成国之重器的同时,也明确了AI和IT具有同样的公共物品属性:希望每个企业、个体都能用得起,并且因此而被赋能。
那么对于AI基础设施而言,如何做到既要用得起又要用得好呢?——必须着眼于降低成本和大规模通用。

1

什么是AI新基建?
智算中心的一般定义是“融合架构计算系统为平台,以数据为资源,能够以强大算力驱动AI模型对数据进行深度加工,源源不断产生各种智慧计算服务,并通过网络以云服务形式供应给组织及个人。”
其作为人工智能产业发展的重要底层基础设施形态,已经成为世界各国竞争角逐的战略布局。在政策扶持、需求牵引下,智算中心“落地潮”在各地被快速掀起。然而在加快步伐的背后,我国人工智能算力基础设施建设也同样面临一系列问题与挑战。
正如9月11日 ,国家工业信息安全发展研究中心在《新一代人工智能算力基础设施发展研究报告》中指出的两点:
一是市场对算力的概念混淆,导致建设方向和建设需求错位;
二是行业定价标准混乱,针对人工智能算力基础设施建设的价格标准并未统一,各地同等规模项目的价格相差巨大。
在建设思路上,中国大多数计算中心采取了算力性能发展优先,再拉动应用发展的策略,忽视上层应用迁移及兼容程度,导致算力系统的初期应用效率偏低,无法完全支撑全面的智能化应用场景需求。
另一方面,算力基础设施和传统基础设施的特征相同,都具有高投入、高风险、高垄断性的特点。实力和能力的限制,意味着智算中心不是满大街都是,而是少量的。
而当前智算中心的建设情况是:哪些地方和企业有能力和实力去建设智算中心,其实没有经过严格的论证,因此导致一些地方的建设的AI基础设施与当地产业发展需求不匹配,出现重建轻用、重复建设等现象。
智算中心的建设成本主要分为三个方面:第一个是基础设施的厂房建设,第二个是需要的服务器、芯片等设备。第三个是后期的运维成本、电费等等。据知情人士透漏:“初步计算,满足基本智算中心的也得一两个亿起步的投入规模。”
但从宏观来看,当前智算中心的建设情况是:目前各地都建,建设成本差距最大达6倍多。据网络公开信息显示,以国内四个人工智能计算中心的折合单位算力建设成本投入为例,可以看到从最高的每100P16位算力投入4.6亿,到最低的7500万,差价达到了6.2倍。
“虽然一些人力成本、电力在地区间存在差异,但六倍的差距差距我还是没有想到的。”国家工业信息安全发展研究中心副总工程师兼信息政策所所长黄鹏转而补充道:“至于原因,我认为是前期调研缺乏,尤其是智算中心的发展处于初期阶段,整个行业还是在摸索、实践过程当中,相信后面随着它发展的越来越好,可持续能力越来越强,成本会降下来。”