瓶颈|当数据中心遇到NVIDIA云原生超级计算( 二 )


??3U一体云原生架构赋予无限算力资源
??NVIDIA?BlueField?DPU的出现为3U一体架构奠定了基础。基于DPU?实现了新的Cloud?Native计算架构,把传统的Infrastrucure操作放到了BlueField?DPU上,由DPU执行通信框架、存储框架、安全框架和业务隔离,让Host里面的CPU和GPU资源都释放给应用,通过这样一个架构可以让业务性能得到更优的发挥,甚至比在裸金属状况下的性能有更好的提升。
瓶颈|当数据中心遇到NVIDIA云原生超级计算
文章插图
??“DPU提供了打开了一个对业务性能优化的新思路,把通信和计算重叠起来,可以通过DPU来加速HPC业务中的通信,由DPU来运行通信框架,由CPU和GPU执行真正的浮点计算。”宋庆春说。
??总之,DPU的出现弥补了数据中心中对于基础设施加速能力的不足,实现了DPU、GPU、CPU?3U一体新型数据中心架构,让数据中心成为新的计算单元,在优化算力资源时,从数据中心更高层次、更高粒度、更大空间里来进行优化成为可能。由此看来,3U一体已经成为数据中心的一个必然的架构。
??NVIDIA云原生软件定义安全应对零信任
??随着数据量越来越大,数据传输速度越来越快,各种异构数据频繁出现,跨平台的整合、各种模型迭代、计算迭代、平台迭代速度越来越快。网络安全已经成为数据安全的最大的威胁,使用传统的思维方式或者工具已经没有办法满足如今的数据中心安全需求。如今,在数据中心里要发现一个漏洞,大概需要超过半年的时间,而要修复这个漏洞需要超过两个多月的时间。零信任(Zero-trust)的前提就对数据中心中的任何人、任何事、任何设备都不信任,如果要是发现问题需要200天,修复问题需要70天,整个数据中心将非常不安全。
??在今年秋季的GTC上,NVIDIA发布了?DOCA?1.2。DOCA?1.2是专门面向零信任(Zero-trust)的安全框架,包括了很多和安全相关的软件。帮助开发者实现网络安全即服务,将数据中心安全保护扩展到用户涉及的应用、数据、设备、存储、基础架构等几乎所有关键点。
??Morpheus是一个基于NVIDIA?RAPIDS、TRITON和深度学习框架的零信任AI应用框架,用于分析来自网络流量日志、应用日志和云日志的流式遥测数据,为网络上的每个应用和用户建立独立的行为档案,一旦出现异常情况,它将提醒安全运营团队注意潜在的安全漏洞。
??写在最后:数据中心趋势展望
??在大型机时代,数据中心一般运行关键且单一的任务,随着软件定义数据中心的出现,在数据中心中会运行多个业务,在这个过程中如何优化利用资源成为瓶颈;随着SDN、数据中心解耦、微服务等新技术的出现,可以解决资源利用的瓶颈问题,但如何提升扩展性,算力就成为了新的瓶颈,NVIDIA?GPU通过高性能的算力,去解决算力上的瓶颈,但GPU能解决的只是一个单机的算力瓶颈,而NVIDIA网络解决了扩展效率和数据中心的瓶颈,但这时又出现性能隔离和安全的新瓶颈,由此,NVIDIA?DPU进而解决了这一困扰,如今,在数据中心中,CPU、GPU、DPU?3U一体缺一不可,这是数据中心成为单元的基础,也是算力成为服务的基础。