为高性能业务上云扫清障碍！云原生超级计算如何做到？( 三 ) 芯东西（公众号：aichip001）作

文章图片
围绕NVIDIABlueFieldDPU和InfiniBand网络架构实现AI工作负载的卸载、加速和隔离的功能，英伟达也提供了基于InfiniBand的开发环境。
经过半天的项目现场演示，以及国内和国际评委的审核和相应评分，最终4支团队脱颖而出，分别获得黑客松的相应奖项。获得一等奖的是SDIC团队，二等奖是知音牛码团队，并列第三的是网络需要配团队和极客天成团队。

文章图片
SDIC团队项目获得了一等奖，其项目名称是《基于BlueFieldDPU数据中心RDMA虚拟化的研究》，主要是基于VirtIO的方案。 VirtIO是IO半虚拟化的解决方案，也是一套通用的IO设备虚拟化程序，所以会对半虚拟化IO设备进行抽象，可对上层应用和各种Hypervisor虚拟化设备提供通信框架和编程接口，减少跨平台带来的兼容性问题，提高驱动程序的开发效率。
VirtIO加速能为以太网和块存储设备解决设备解耦、高扩展性、云管理（迁移）的问题。 VirtIO处于早期开发阶段，所以RDMA没有实现VirtIO规范，内核驱动也没有进入主流Linux核心，目前DPU仅支持virtIO-net和virtIO-blk网络虚拟化和存储虚拟化功能，没有virtIO-rdma的部分。
项目目标即是用英伟达BluefieldDPU搭建一套仿真平台，虚拟化RDMA硬件设备，通过主机侧运行vhost ，通过传统网络（TCP）和SoC上的InverseLayer通信，由其转换为RDMA网络（IB），从而减少主机性能开销，实现更高效的虚拟化过程。未来的设计是想把virtIO-rdma的加速和仿真的部分迁移到DPU上，形成一种卸载，从而提供更好的加速性能、减少相应的开销。
二等奖获得者知音牛码团队的项目名称是《分布式智能键值存储引擎》，称为KV存储或键值存储数据库，属于一种非关系型数据库，每个键值都有唯一的Key相关联，所以称之为键值对。分布式键值存储也称为分布式哈希表，键值对分布在多台服务器，提供相应的数据库查询检索读写的功能。
本项目是在服务器采用英伟达BlueFieldDPU ， DPU内存中构建一个哈希表，实现键值对的存储。主机会运行RocksDB这样一个分布式键值存储数据库，一方面通过内存哈希表的查询提供非常快的访问速度，基于RDMA技术可加速数据写入内存，另一方面利用DPU近数据计算的优势加速哈希表，快速缓存新写入的数据。这三大方面可大大提升分布式键值存储的写入性能，最终提升整个数据库键值数据的访问。
英伟达BlueFieldDPU通过过滤器去做读写特征的筛选，可以在里面部署一个轻量级机器学习模型，更好地区分热数据和冷数据。热数据是经常会访问的、读写频次比较高的数据，一直保存在哈希表里面，访问次数比较少的冷数据键值对就会写入到主机RocksDB ，能够更快地响应其它主机对KV数据的访问。
结语：为高性能业务上云铺平道路
总体来说，云原生超级计算技术主要面向高性能业务的上云，如传统HPC业务、大规模AI训练任务和推荐任务等，能够实现在云上和超算中心上一样的性能，目前微软已在Azure公有云上实现了这一技术的部署与应用。这意味着着未来高性能应用不必依赖于昂贵的独立计算资源，可充分利用云的弹性服务来满足应用的需求。
DPU中国黑客松已经成为开发者学习、实践使用NVIDIABlueFieldDPU和NVIDIADOCA软件开发套件的一个难得机会。参赛团队可以利用DOCA驱动、DOCA库、开发工具和相关文档，构建、优化NVIDIABlueFieldDPU ，做基础设施相关的加速应用开发。通过黑客松比赛，英伟达也为业界培养了更多的DPU和DOCA开发人才。