GPU|高端GPU禁售传闻声起 BAT们遭遇紧张时刻( 二 )


“此前 , 具备FP64能力的相关产品不被允许直接卖给中国的超算中心 , 但有规避途径 , 以其他机构和实体的名义换个马甲也能购买到 , 但此次更像是美国担心中国互联网企业买了之后用于超算服务 , 于是互联网企业也不被允许 。 ”该人士表示 。
在朱晶看来 , 此次针对双精度计算能力的高端GPU芯片禁售 , 并非针对GPU和企业 , 而是类似数日前美国针对中国14nm以下设备 , 3nm GAA工艺的EDA工具软件的类似限制 , 在某个技术节点上采取封杀策略 , 而这样带来的影响面更广 。
“看似依然是对我国超算的进一步封锁 , 但波及范围已经远远放大 , 并且技术点的断供还要考虑对上下游的牵连 , 会让行业的痛感更强烈 。 ”朱晶表示 。
影响与应对
从目前AMD和英伟达两家企业看 , 如上所述 , AMD的相关产品正处于准备中国市场推广的当口 , 英伟达的A100系列产品在中国拥有非常大的出货以及众多客户 , 如果禁令施行 , 无论是对两家企业还是中国的互联网厂商都会产生较大影响 。
朱晶分析称 , 如果禁售传言成真 , 未来英伟达和AMD可能会把不带FP64的中国定制版(简化版)产品卖给中国互联网厂商 , 这相当于为中国市场定制产品 , 涉及重新流片 , 同时也面临库存清出所带来的成本挑战 。
在排除定制版的极端情况下 , 对于中国的互联网厂商 , 可以通过购买两家企业的中低端卡做组合 , 实现性能最优的方式解决问题 。 尽管通常情况下 , 成本并非互联网厂商首要考虑目标 , 但对于成本超支仍有忍耐阈值 , 同时还要考虑在节能减排的背景之下能耗所带来的影响 。 而这种情况 , 本身对AMD和英伟达的营收损伤也较大 。
一位GPU行业人士告诉集微网 , 互联网企业在计算数据中心整体成本支出时 , 在高端产品上 , 一次性购买成本、机架占位/人工服务费(运维)、电费三者所占比重大约为3:3:4 , 如果按照传闻所言 , 英伟达今年发布的最先进的4nm工艺的H100被禁 , 只能采用12nm的V100产品 , 考虑到增加的机架费用、功耗增加所带来的电费 , 整体而言将超过3倍的支出 , 如果再考虑到3-5年的运营周期 , 成本上将高出许多 。
“而如果在超算领域 , 电费约占运营费用的七成以上 , 整体成本支出也会变得更加昂贵 。 ”该人士表示 。
此外 , 也有观点称禁售将会对AI训练的高端芯片产生影响 , 但有行业人士指出 , 目前这些产品的实际使用量不大 , 且大部分互联网公司此前已有备货 。
GPU国产替代加速
近几年 , 国内GPU企业受到空前关注 。 老牌CPU厂商如龙芯、海光等均实现上市 , 且在GPU领域寻求突破 , 龙芯中科自研GPU已首度亮相 , 海光的DCU(GPGPU)也逐渐打出知名度 , 此外 , 也涌现出一批颇具知名度的初创GPU企业 。
行业人士看来 , 尽管目前 , 国内芯片公司并不具备实现FP64的技术能力 , 但如果美国断供 , 将会利好国内GPU企业 。
【GPU|高端GPU禁售传闻声起 BAT们遭遇紧张时刻】云岫资本合伙人兼首席技术官赵占祥就认为这是对国产数据中心GPU的重大利好 。
“计算芯片最大的门槛是软件门槛 , 软件用的人越多越稳定 , 芯片越好卖 。 美国倒逼中国客户用国产GPU , 国产生态一旦建立起来 , 即使美国再放开 , 也很难限制国产厂商 。 ”赵占祥说 。
此外 , 百度等互联网企业已经发布自研AI超算芯片产品 , 但存在与原CUDA生态的兼容问题 , 需要投入较长时间完善 。 海光DCU8系列Z100产品数据接近AMD的MI100产品 , 同时兼容AMD的ROCM生态 , 被一定程度看好 。