hpc|让超算再升级的存储系统,华为凭什么?

hpc|让超算再升级的存储系统,华为凭什么?
文章插图
世界上第一台计算机叫什么?很多人可以不假思索地回答——“埃尼阿克” (ENIAC)。
那么,“埃尼阿克” 最初被用来干什么呢?少有人知道,1946年,“埃尼阿克” 是为了解决弹道计算问题而生,宾夕法尼亚大学花费40万美元巨资才研制出“埃尼阿克” ,当时的计算机是一种战略物资。
在很长一段时间后,个人PC的普及才让计算机逐渐进入大众视野,IBM和Apple都是第一代家用电脑厂商,而计算机作为战略物资的属性以另一种名字保留了下来,也就是 HPC (High Performance Computing,高性能计算)。
HPC成为计算机科学的一个分支,使用超级计算机和并行处理技术解决复杂计算问题,主要瞄准大规模科学问题的计算和海量数据的处理,如科学研究、气象预报、计算模拟、CFD/CAE、生物制药、基因测序、图像处理等等。每年的全球HPC Top 500高性能计算机排行榜都备受瞩目。
近年来,大数据和AI等新兴应用催生 HPC 发生另一种变化,不同于上世纪计算机的向下平民化, HPC 向上拥抱更为复杂的业务负载,使得传统HPC开始向 HPDA (High Performance Data Analytics)方向演进。
hpc|让超算再升级的存储系统,华为凭什么?
文章插图
华为常务董事、ICT产品与解决方案总裁汪涛
在2021年华为全联接大会上,华为常务董事、ICT产品与解决方案总裁汪涛介绍了数字基础设施七大创新与客户实践,其中业界首个面向HPDA的分布式存储OceanStor Pacific引起热议,何谓高性能数据分析HPDA,HPDA又需要什么样的分布式存储?不妨一观。
HPDA:从数据中攫取价值我们手中智能手机的算力,远超NASA在1969年登月计划中最先进计算机的算力,但相较于手机,HPC所要解决业务的复杂水平,也呈现指数级发展,一大变化就是数据的爆炸式增长,使得原有HPC架构的存储不堪其重。
传统HPC主要从仿真物理模型中计算价值,需求是无与伦比的大算力,而HPDA泛指利用HPC资源的数据密集型负载,典型特点是数据量大、时效性强以及算法复杂,从数据本身提取价值,两者业务逻辑不同,导致存储需求不同。
例如地震勘探从二维向三维的演进中,数据量增加了5-10倍;电影渲染从2K升级到8K的革命中,数据量增长16倍;卫星测绘领域,探测精准度由20米缩小到2米,数据量同比增长70倍。海量的数据,需要高性能的存储,这是HPC向HPDA演进要解决的根本性问题。
传统HPC的存储主要用来文件共享、Scratch和归档,AI业务负载则涉及到数据收集、输入、清洗、训练、推理和归档一系列复杂操作,原有存储系统并不是为这种存储工作流程而设计的,自然也就无法很好满足新存储的需求。
【 hpc|让超算再升级的存储系统,华为凭什么?】在关键性能要求上,传统HPC负载通常基于顺序大I/O型,AI业务负载需要顺序大和随机小I/O型的混合,用于AI训练的数据存取需要快速的随机小I/O型。
应用场景的变化催生了各种耐用性和弹性解决方案需求。例如归档需要极具高性价比的解决方案,没有苛刻的性能要求;传统的临时应用需要将临时结果转移到持久存储,需要高性能以防止出现故障;HPDA 解决方案需要混合存储需求同时满足高性能、瞬态存储和持久弹性存储的不同要求。
此外,当存储系统变得复杂化,内部多种协议发展为另一种壁垒,不同数据采用不同的访问方式,每种访问方式都需要独特的协议支持,横亘在业务负载中消耗通信时间和计算资源。
据IDC统计,全球67%的高性能计算中心(HPC)已经在使用AI、大数据相关技术,HPC与AI、大数据加速融合,如何从海量数据中更高效、更经济地释放更大的数据价值,成为迫切诉求,存储系统的改变至关重要。