frontier|全球超算TOP 500强出炉:中国再夺总榜第一!( 二 )



即便PK算力 , 我们也是世界前列 。
【frontier|全球超算TOP 500强出炉:中国再夺总榜第一!】超算对于大国的意义巨大!
HPE(Frontier运营商)执行副总裁、高性能计算和人工智能部门总经理Justin Hotard曾表示 , 前沿在速度和性能方面取得了突破 , 让我们有机会解答那些以前甚至都不知道要问的问题 。
美国橡树岭国家实验室相关负责人Jeff Nichols表示 , 来自世界各地的科学家和工程师都将利用该套系统(指Frontier)非凡的计算速度 , 来解决我们这个时代全人类最具挑战性的一些问题 。
神威·太湖之光的典型应用场景有药物的分子动力学模拟、3D渲染、数字水池和大气动力学等 , 比如天气预报、雾霾预警、3D大片、新型材料和新型药物的研发等 , 也就是说 , 这些超算们的应用场景会涉及到国防、军事、医疗、高能物理、工程设计、地震预测、气象观测、航天技术、国家高精尖科研的方方面面 , 无论实际需求还是长远意义都很重大 。
这也是各大国不遗余力搞超算军备竞赛的真相!
我国超算 , 们早就拥有了设计一流芯片的能力 。

我国的科研人员也早就想到了硬件上的限制 , 为了不被美国卡脖子 , 当初超算项目立项之际 , 就刻意避开了X86\\ARM\\Risc-V\\MIPS四大主流芯片架构 , 转而选择了有点冷门却系出名门的Alpha 21364架构 , 基于Alpha开发拓展出了一套有自主知识产权的指令集 , 也就是后来的申威指令集 。

2006年 , 国家超算无锡中心(江南所)设计出自主微结构的申威1 , 基于130nm制程工艺 , 单核心CPU , 主频只有900MHz , 集成了5700万晶体管;
2008年 , 江南所推出了申威2 , 基于130nm工艺 , 双核心CPU, 主频抬升到1.4GHz;
2010年 , 申威1600横空出世 , 基于65nm工艺 , 但是性能与功耗却超越了当时的Intel , i7 980xe 6核心功耗130W , 申威1600功耗仅70W , 申威1600在1.1GHz的主频率时 , 双精度浮点运算能力达140.8G , 而i7 980xe 6核心运行在3.2GHz频率时 , 双精度浮点只有107.55G;

2016年 , 神威·太湖之光用的申威26010 , 双浮点峰值已达3.06TFIops , 与Intel的Kight Landing处在同一水平 , 申威26010用落后英特尔和AMD几乎2整代的工艺却做出了不低于后两者的性能 , 足见当初选择Alpha 21364架构的明智与后续自研拓展指令集的优势 。
如今 , 制程工艺上 , 限制较明显 , 但可以选择在功耗控制和堆核心上下力气 , 花更多的精力 , 利用与代工厂深度合作的主频优化、自研架构&指令集方面的优势缩短硬件性能差距 。
回到了前文的问题 , 这几年 , 神威和天河们发展得怎样了?
早在2018年节点 , 我国已经正式布署了神威、天河和曙光三种不同技术路线的E级超算(跟Frontier同水平线的百亿亿次/秒) , 其中天河3号原型机更是在当年7月就通过了验收 , 同年8月5日 , 神威E级超算也顺利通过了科技部专家组的验收 , 同年10月24日 , 来自经济日报的一篇报道显示 , 神威E级原型机、天河三号E级原型机和曙光E级原型机系统全部完成交付 。

这说明什么?说明我们早已掌握了E级超算的相关技术链啊 。



2022年4月 , 中国科学技术大学、国家海洋科学与技术试点实验室 、北京大学数学科学学院、无锡国家超级计算中心和中国海洋大学组成的联合团队 , 公布了一篇超算模拟复杂量子多体的文章 。

据该文描述 , 在介绍高性能计算环境时提及了申威26010 Pro的架构 , 该CPU为申威26010的升级改进款 , 拥有6个计算组 , 每个计算群有1个管理核心和64个计算核心 , 较之于仅有4个计算组的申威26010 , 单片性能至少提升50% , 文章称呼为新一代神威超级计算机 , 似乎也印证着该台超算大概率即为神威·海洋之光 。