资源|国家超级计算济南中心联合华为发布《算力互联网技术白皮书》

近日,在2021第三届中国超级算力大会上,国家超级计算济南中心(以下简称“济南超算”)联合华为发布《算力互联网技术白皮书》(以下简称“白皮书”),围绕算力互联网发展趋势和技术挑战,阐述算力互联网解决方案的架构、关键技术以及实践经验,以加速未来计算模式转变,推动计算性能维持指数级增长。
资源|国家超级计算济南中心联合华为发布《算力互联网技术白皮书》
文章插图

图为国家超级计算济南中心联合华为发布《算力互联网技术白皮书》。新华网 发(主办方供图)
济南超算的研究员张玮表示:“超算业务具有强算力、大数据、高通量等特点,但当前也面临用户接入难、算力变现难、算力资源使用不均衡、安全防护难的问题。因此,需要构建一张具备集约化、高算力、服务化和高安全四大特征的算力互联网。”
此次发布的白皮书中提出了算力互联网解决方案,以算力资源为核心,支持网络动态感知算力资源分布,实现动态调整最优路径并提供差异化保障服务,从而满足新一代超算数据中心大规模超算组网的需求。算力互联网解决方案由算力生产网、算力配给网、算力一体安全组成。
基于算力互联网的整体架构,张玮还分享了算力互联网络的联合创新测试结果。测试表明,在算力生产网,开启网算一体后的RoCE网络,相比超算专网的任务完成时间最大减少27%;采用直连拓扑相比传统CLOS组网,计算性能最大提升29%;基于长距无损算法,从济南-淄博的RoCE网络平均时延最多可降低49.8%。在算力配给网,部署SRv6后,带宽利用率提升50%;开启随流检测功能,可以实现分钟级故障定位。
未来算力网络将从算力互联走向算力协同,进而探索算力融合。济南超算与华为将继续携手合作,通过统一算力服务平台,实现多超算中心的统一资源管理、统一用户管理、统一记账、资源融合调度、和应用协同服务,进而实现高效利用算力资源和高质量用户服务,为行业和重要应用领域的科学研究、经济建设和社会发展提供优质的算力基础设施,实现可持续发展。
【 资源|国家超级计算济南中心联合华为发布《算力互联网技术白皮书》】来源:新华网