程序员|偶然当程序员却拿下图灵奖 超算榜单之父讲述人生开挂经历( 三 )


天河一号,是中国第一台登上榜首 (2010年11月) 的超级计算机,它在榜首呆了六个月时间 。
上月中旬,美国达拉斯举行的 SC22 会议上,第60期TOP500排行榜结果公布,排名第一的依旧是上次夺魁的Frontier 。
程序员|偶然当程序员却拿下图灵奖 超算榜单之父讲述人生开挂经历
文章图片

中国的两台超算,神威太湖之光和天河2号,分别拿下了排行榜第7和第10位 。
统计所有上榜TOP500的超算,中国共占据162台,虽较去年的173台有所下降,但仍以领先美国36台的优势,稳居世界第一的宝座 。
在算力方面,美国在已部署的算力中以43.2%排名第一,中国以10.6%位列第四 。
Jack Dongarra拿出了一组十分直观的数据 。
现在的计算机,最快每秒是1.1 exaflops,TOP500的最后一名则是1.73 petaflops 。
而Jack Dongarra的笔电是拥有M2处理器的MacBook,它的运行速度是426 gigaflops 。
近30年前,第一代TOP500的榜首,属于洛斯阿拉莫斯国家实验室(LANL)用来设计核武器的计算机CM.5,它拥有一千个处理器,运行速度大约是60 gigaflops 。
不用说当年的第一和今日的第一如何如何,今天家用笔电的运行速度,已经远远超过了30年前的世界最快 。
好了,最后还是说回老爷子 。
程序员|偶然当程序员却拿下图灵奖 超算榜单之父讲述人生开挂经历
文章图片

年逾七十的他,至今依然活跃在高性能计算领域的一线,今年更是夺得“计算机界的诺贝尔奖”图灵奖,其中,LINPACK,正是他拿图灵奖的获奖工作之一 。
ACM总裁Gabriele Kotsis表示,Jack Dongarra是高性能计算社区中,最重要且积极参与的领导者之一 。
超算的新benchmark
也是这位积极的领导者提出,超算需要新的基准测试了!
背后原因不难理解——
LINPACK基准测试强调浮点运算,它的核心是矩阵乘法 。
多年以前,团队设计LINPACK时,浮点运算还是一个很重要的衡量标准 。
今时今日,浮点计算已经不那么重要了 。
放眼望去,所有的超算都为浮点计算做了“过量”的准备——Jack Dongarra本人是如此评判的 。
是以,他认为当务之急是需要有新的基准来关心移动数据,也就是HPCG 。
程序员|偶然当程序员却拿下图灵奖 超算榜单之父讲述人生开挂经历
文章图片

简单介绍,HPCG一个共轭梯度算法,它着眼于解决稀疏矩阵问题,而不是密集矩阵 。
这恰恰满足了今时今日在实际应用中存在的问题 。
相比于旧的基准HPL,HPCG能更好地反映应用程序的效果,但它给出的执行速度的数字会低很多 。
究其背后的原因,是随着GPU的增强,计算机已经可以非常迅速地进行浮点运算,所以HPL得出的数据,其实是超算潜力被夸大后的结果 。
相对应地,HPCG强调不是浮点数而是移动数据,这正是带宽和延迟会限制超算性能的地方 。
就拿日本超算富岳(Fugaku)来说吧 。
LINPACK基准测试中,富岳排名第一,达到了理论峰值的3%;而运行新基准,富岳只得到了理论峰值的0.8% 。
这意味着计算机并没有发挥出它们的潜在性能,需要更仔细地进行研究 。
程序员|偶然当程序员却拿下图灵奖 超算榜单之父讲述人生开挂经历
文章图片

有趣的一点是,TOP500超算榜上,几乎97%都在使用x86这种架构,只有5台超算使用ARM处理器 。