为高性能业务上云扫清障碍!云原生超级计算如何做到?
文章图片
芯东西(公众号:aichip001)
作者|ZeR0
编辑|漠影
芯东西11月25日报道 , 随着数据和计算规模暴涨 , 超级计算中心和公有云的需求正走向融合 , 应对当前云和数据中心面临的挑战 , 英伟达(NVIDIA)认为 , 云原生超级计算会成为数据中心的新架构 。
顾名思义 , 云原生超级计算融合了云与高性能计算的优点 , 既拥有高性能计算的强大算力 , 又兼具云服务的安全性与易用性 。
云原生超级计算架构具体采用了哪些关键技术 , 来解决传统数据中心架构遇到的瓶颈?它能带来哪些性能的优化?围绕这些问题 , NVIDIA网络亚太区高级总监宋庆春、NVIDIA网络技术专家崔岩与芯东西等媒体进行了交流 。
文章图片
一、云原生超级计算:计算和通信并行处理
传统数据中心的一个典型架构 , 即是由CPU处理应用、由GPU对应用进行加速 , 通过网络进行大规模的连接 。 如果CPU既做计算 , 又做存储、安全等各方面的事务 , 难免会分身乏术 , 如在运行计算任务途中不断暂停抽身去处理通信任务 , 造成“系统噪声” , 进而影响整个系统的性能 。
由于公有云在支撑多租户和多任务 , 即便每个任务有独立的计算资源、独立的内存资源和通过QoS技术做带宽分配 , 当流量走到网络中 , 还是会造成不同任务之间的流量冲突 , 导致业务性能下降 , 无法实现在独立计算平台上单独运行一个业务的性能 。
而云原生超级计算架构通过引入DPU芯片及网络计算技术 , 计算和通信是并行处理的 。 DPU可以帮助CPU分担一些存储、租户隔离安全、系统管理等基础设施操作 , 这样CPU就能在处理计算任务上更加高效 。 这种架构改进 , 可以用更低成本或更少硬件构建更高性能的系统 。
文章图片
云原生超级计算架构可以用异构网络的方式优化性能 , 其中有一张高性能的管理网络 , 能对整个数据中心搜集分析信息 , 然后反馈到数据中心 , 提高数据中心的安全性或运行效率 。
从上周发布的TOP500榜单可以看到 , 英伟达的GPU和网络处于绝对领先的地位 , 72%的系统采用了英伟达GPU或网络(InfiniBand、以太网) , TOP100系统中有63%采用了InfiniBand 。 今年由英伟达旗舰计算芯片HopperGPU和InfiniBand连接的系统以65.09GF/W的性能取得了Green500榜单第一名 。 Green500榜单前100名中 , 有75%的系统在采用InfiniBand 。 最新的IO500榜单前5大系统中 , 有4个采用InfiniBand 。
文章图片
DPU在InfiniBand平台上的应用和以太网上的主要区别在于:1、更加侧重于业务的性能提升 , 实现了计算和通信的重叠 , 让CPU资源完全释放给了应用的计算任务;2、利用DPU的算力资源参与应用的计算 , 为应用贡献了更多的算力;3、DPU运行存储框架 , 实现了基于文件存储的模拟 , 充分发挥远端共享文件存储系统的性能;4、实现了增强的Telemetry技术 , 利用DPU来提供应用的信息给用户分析和训练 , 进一步优化性能;5、DPU还是应用性能隔离的重要组件 , DPU可以和InfiniBand拥塞控制技术一起提供Pre-Active拥塞控制 , 实现性能隔离;6、DPU还在零信任环境中扮演重要作用 , 用于隔离应用和其它基础设施操作、存储操作和通信操作 。
- 华为已行动,又是一个千亿BG,奔驰已经加入
- 好事成双!华为鸿蒙OS重要时刻,两大巨头均宣布新消息
- 面对华为,台积电的态度有了新变化
- 华为荣耀|荣耀Magic Vs系列“黑科技”汇总!荣耀研发人员太强了
- “遮羞布”被撕碎?最新5G调查数据出炉,网友:华为4G手机还能活
- 华为nova 20 系列或搭载骁龙8+,新专利公开
- 耳机|融合怪来了,华为推出自带TWS耳机的智能手表
- 华为鸿蒙系统|国产手机为何死守安卓,却不愿加入华为鸿蒙?
- OPPO|高频PWM调光会不会成为手机好屏幕的一个标准?
- 华为mate|华为Mate Xs 2鸿蒙操作系统3.0全网推送更新,快来体验北斗卫星消息