耗资4亿美元!Meta将采购2000套DGX A100,打造全球最强AI超算

耗资4亿美元!Meta将采购2000套DGX A100,打造全球最强AI超算
文章图片
1月25日消息 , 近日 , Meta(Facebook母公司)宣布建造全球最强大的AI超算 , 名为AIResearchSuperCluster(RSC) 。 其目标是最终运算速度(Linpack)达到220petaflops(每秒22亿亿次) 。 实际上 , RSC已经投入运行 , 但后续还会追加运算节点 。
目前 , RSC的配置是760套NVIDIADGXA100AI系统 , 也就是1520颗AMD64核EPYC处理器(第二代 , 代号Rome)、6080颗NVIDIAA100GPU 。
耗资4亿美元!Meta将采购2000套DGX A100,打造全球最强AI超算
文章图片
DGXA100
I/O方面 , 网络带宽200Gbps、175PBFlashArray、10PBFlashBlade以及46PB缓存 。
耗资4亿美元!Meta将采购2000套DGX A100,打造全球最强AI超算
文章图片
根据初期测试显示 , 其在进行视觉运算时 , 工作速度较之前的AI运算系统提升20倍 , 运行NVIDIANCCL的速度则提升9倍以上 , 且在训练大规模的语言模型上则提升3倍 。 这也意味着SRC可在三周内完成拥有数百亿参数的模型 , 而之前的系统需花费九周的时间 。
耗资4亿美元!Meta将采购2000套DGX A100,打造全球最强AI超算
文章图片
Meta指出 , 其研究团队目前正在使用这台超级计算机训练AI模型 , 进行自然语言处理和电脑视觉研究;目标是希望SRC有朝一日能在1艾字节的数据集上训练包含超过1万亿个参数的模型(1艾字节大约相当于3.6万年的高画质影片) 。
Meta也强调 , 尽管SRC已开始运行 , 不过其仍在开发中 , Meta将努力提升SRC中的GPU数量 , 预计未来会再追加1240套DGXA100系统 , 单GPU规模就多达16000颗(单颗显存40GB) 。 这将使AI训练性能提高2.5倍以上 。 当今年夏天SRC完全建置完成后 , 将成为世上最快的AI超级电脑 。
资料显示 , NVIDIADGXA100发布于2020年 , 单套系统售价高达19.9万美元 。 也就是说 , RSC最终完工时 , 单采购DGXA100就需要花费3.98亿美元(约合人民币25亿) 。
耗资4亿美元!Meta将采购2000套DGX A100,打造全球最强AI超算】编辑:芯智讯-林子