为高性能业务上云扫清障碍!云原生超级计算如何做到?( 三 )


为高性能业务上云扫清障碍!云原生超级计算如何做到?
文章图片
围绕NVIDIABlueFieldDPU和InfiniBand网络架构实现AI工作负载的卸载、加速和隔离的功能 , 英伟达也提供了基于InfiniBand的开发环境 。
经过半天的项目现场演示 , 以及国内和国际评委的审核和相应评分 , 最终4支团队脱颖而出 , 分别获得黑客松的相应奖项 。 获得一等奖的是SDIC团队 , 二等奖是知音牛码团队 , 并列第三的是网络需要配团队和极客天成团队 。
为高性能业务上云扫清障碍!云原生超级计算如何做到?
文章图片
SDIC团队项目获得了一等奖 , 其项目名称是《基于BlueFieldDPU数据中心RDMA虚拟化的研究》 , 主要是基于VirtIO的方案 。 VirtIO是IO半虚拟化的解决方案 , 也是一套通用的IO设备虚拟化程序 , 所以会对半虚拟化IO设备进行抽象 , 可对上层应用和各种Hypervisor虚拟化设备提供通信框架和编程接口 , 减少跨平台带来的兼容性问题 , 提高驱动程序的开发效率 。
VirtIO加速能为以太网和块存储设备解决设备解耦、高扩展性、云管理(迁移)的问题 。 VirtIO处于早期开发阶段 , 所以RDMA没有实现VirtIO规范 , 内核驱动也没有进入主流Linux核心 , 目前DPU仅支持virtIO-net和virtIO-blk网络虚拟化和存储虚拟化功能 , 没有virtIO-rdma的部分 。
项目目标即是用英伟达BluefieldDPU搭建一套仿真平台 , 虚拟化RDMA硬件设备 , 通过主机侧运行vhost , 通过传统网络(TCP)和SoC上的InverseLayer通信 , 由其转换为RDMA网络(IB) , 从而减少主机性能开销 , 实现更高效的虚拟化过程 。 未来的设计是想把virtIO-rdma的加速和仿真的部分迁移到DPU上 , 形成一种卸载 , 从而提供更好的加速性能、减少相应的开销 。
二等奖获得者知音牛码团队的项目名称是《分布式智能键值存储引擎》 , 称为KV存储或键值存储数据库 , 属于一种非关系型数据库 , 每个键值都有唯一的Key相关联 , 所以称之为键值对 。 分布式键值存储也称为分布式哈希表 , 键值对分布在多台服务器 , 提供相应的数据库查询检索读写的功能 。
本项目是在服务器采用英伟达BlueFieldDPU , DPU内存中构建一个哈希表 , 实现键值对的存储 。 主机会运行RocksDB这样一个分布式键值存储数据库 , 一方面通过内存哈希表的查询提供非常快的访问速度 , 基于RDMA技术可加速数据写入内存 , 另一方面利用DPU近数据计算的优势加速哈希表 , 快速缓存新写入的数据 。 这三大方面可大大提升分布式键值存储的写入性能 , 最终提升整个数据库键值数据的访问 。
英伟达BlueFieldDPU通过过滤器去做读写特征的筛选 , 可以在里面部署一个轻量级机器学习模型 , 更好地区分热数据和冷数据 。 热数据是经常会访问的、读写频次比较高的数据 , 一直保存在哈希表里面 , 访问次数比较少的冷数据键值对就会写入到主机RocksDB , 能够更快地响应其它主机对KV数据的访问 。
结语:为高性能业务上云铺平道路
总体来说 , 云原生超级计算技术主要面向高性能业务的上云 , 如传统HPC业务、大规模AI训练任务和推荐任务等 , 能够实现在云上和超算中心上一样的性能 , 目前微软已在Azure公有云上实现了这一技术的部署与应用 。 这意味着着未来高性能应用不必依赖于昂贵的独立计算资源 , 可充分利用云的弹性服务来满足应用的需求 。
DPU中国黑客松已经成为开发者学习、实践使用NVIDIABlueFieldDPU和NVIDIADOCA软件开发套件的一个难得机会 。 参赛团队可以利用DOCA驱动、DOCA库、开发工具和相关文档 , 构建、优化NVIDIABlueFieldDPU , 做基础设施相关的加速应用开发 。 通过黑客松比赛 , 英伟达也为业界培养了更多的DPU和DOCA开发人才 。