|对话天翼云:DPU重在“平衡”

|对话天翼云:DPU重在“平衡”

文章图片




作者 | 由仪
DPU(Data Processing Unit)成为云厂商乃至芯片厂商的新战事 , 不仅吸引了众多初创厂商入局 , 甚至传统芯片巨头也强势进场 。
业内公认 , DPU将成为继CPU、GPU的“第三块主力芯片” , DPU能够将CPU处理效率低下、GPU处理不了的负载 , 卸载到专用DPU上 , 包括执行协议处理、数据安全、算法加速等多样化的专用任务 。
在云计算加速普及的当下 , 通信能力和计算能力是数据中心基础设施的两个重要发展方向 , 随着网络传输带宽的增加 , 数据中心的计算资源被愈加复杂的基础设施操作所占据 , 使得业务处理遭遇瓶颈 。
据《专用数据处理器(DPU)技术白皮书》 , 业界常用带宽性能增速比(RBP , Ratio of Bandwidth and Performancegrowth rate)对网络带宽增速与CPU性能增速进行描述 , 即RBP=BWGR/Perf. GR 。
RBP指标 2010年的数值1 , 到2021年数值超过10 , CPU几乎已经无法直接应对网络带宽增速 , 因此DPU本质源于网络传输速率增速与CPU芯片性能增速差距加大 。
然而 , 不论是产品定义、技术路线、客户场景等 , 目前DPU市场尚处于早期发展阶段 , 行业格局也不明晰 , 为此 , TechForWhat近期对话天翼云资深研发专家、自研DPU技术负责人刘禄仁 , 从中一窥DPU行业发展方向 。
刘禄仁认为 , DPU技术并没有绝对的技术难题 , 而是要在众多要求之下找到平衡点 , 性能和稳定的平衡 , 软件和硬件的平衡 , 产品试错和规模商用的平衡 , 诸如此类 , DPU还处于百花齐放的阶段 。

以下为对话实录 , 略经编辑:
TechForWhat:DPU在天翼云技术体系中扮演一个怎样的角色?
刘禄仁:首先抛开DPU来讲 , 基础设施是我们做云计算的基石 , 它的降本增效对于云厂商来说很重要 , 基础设施涉及到基础硬件、基础软件、软硬协同 , 还有一些技术资源 , DPU又是软硬协同里面最重要的方面 。
在天翼云软硬一体的“紫金架构”中 , DPU是核心的一环 , 它类似于阿里云的神龙架构里面的MOC卡 , 将计算、存储、网络和安全从传统的CPU侧迁移到自研的软硬结合体系中 , 天翼云和其他厂商还有些不一样 , 我们会涉及到很多国产化场景 , 所以紫金架构能够是面向不同的算力和全国产化自主可控的场景 , 打造了类似于第二个平面 。
TechForWhat:云厂商、芯片厂商都在自研DPU , 你认为做DPU的门槛体现在哪?
刘禄仁:这会有三个维度 , 第一 , 认知是最大的门槛 , 云计算业务比较复杂 , 大家对需求的理解是不同的 , 每一家的技术演变 , 都会有各种特点或差异 。
第二个 , DPU并不只用在数据中心 , 很多初创公司也提到端网协同的的场景 , 边缘场景也有需求 , DPU的需求更加发散化 。
第三 , DPU是芯片 , 做芯片的门槛本身就比较高 , DPU又涉及到云计算里面的计算、存储、网络三个大方面 , 不仅有传统芯片设计里面的验证驱动算法 , 还涉及到传统芯片不怎么涉及的业务软件和协议栈 , 整体系统非常复杂了 。
传统芯片更多是一个单模块的功能点 , DPU需要软硬协同 , 这样让原本门槛很高的芯片开发 , 又要拔高到一个新的维度 。
TechForWhat:为什么说DPU是典型的应用驱动型芯片?
刘禄仁:现在初创DPU厂商也频繁拜访各家云厂商 , 虽然很多人也是从云厂商出来的 , 但都是对需求的理解集中在一些单点 , 并不是面或者一个系统 , 不会从整个云的角度来考虑 , DPU厂商频繁拜访云厂商 , 侧面反映出他们对这一块把握的不是特别准 。