5G|三问CIPU,阿里云的葫芦不卖“药”( 二 )


很明显 , 无论是DPU还是IPU , 都不是完美的解决方案 , 阿里云已经是个成年人了 , 它不做选择题 , CIPU就是在这样的背景下诞生了 , 既能云化虚拟化管控数据中心 , 又能解决数据迁移带宽的问题 。


阿里云官方公布 , 基于CIPU和飞天云计算架构体系 , 在通用计算、大数据、人工智能等核心场景的计算测试性能:
●在通用分布式计算领域 , Redis性能提升了68%、MySQL提升了60% , Nginx提升了30%;
●高吞吐类的互联网业务上云之后 , 比自建物理机的集群吞吐量提升了30% , 业务高峰期延迟下降了90%;
●在大数据和AI等计算与数据双密集场景下 , 相比传统的TCP网络 , 弹性RDMA高性能网络的吞吐能力提升30%以上;
●云原生方面 , 容器启动速度快了350% , 在Serverless 场景下6秒可拉起3000个弹性容器实例 。
阿里云在CIPU的研发过程中采用了“软件定义+硬件加速”的思路 , 将其定位为飞天云操作系统的专用处理器 , 如此一来 , 不但通过硬件提高性能解决云计算发展中遇到的痛点 , 还能通过软件提供灵活性 , 在系统、应用和资源的管理上大大加强 。
02 , 云厂商那么多 , 为什么是阿里云发布CIPU?第二问题最直接的答案是阿里云自身业务需求的驱动 。
上文有提到 , 如今阿里云的IDC规模已经极为庞大 , 在全球范围内管理着上百万台服务器 , 阿里云遇到的问题肯定比99%的云厂商都要多 , 加之行业内还没有出现公认的“完美方案” , 而阿里云恰恰又有解决上述问题的能力 , 研发CIPU也就顺理成章 。
早在2016年 , 阿里巴巴内部就开始了技术长征 , 2017年发布了一个叫“神龙卡”的设备 , 用来应对传统CPU计算架构系统难以解决的问题 , 阿里云后续还对“神龙卡”进行了多轮迭代 , 逐渐完善了编排调度、硬件加速等更多能力 , 以“神龙卡”为基础 , 阿里云又进行了一次从0到1的创新 , 即我们现在看到的CIPU 。
事实上 , 在过去的几年里 , CIPU已经承受过像“双十一”、12306春运抢票这种体量的性能和压力测试 , 甚至有一些阿里云的客户提前“尝鲜” , 使用过基于CIPU的云计算服务了 , 虽然用户层面对底层硬件层的感知不明显 , 但阿里云的工程师们心里还是很清楚 , “自己用过觉得好 , 才是真的好” 。
在阿里云自身业务的驱动之外 , 出于行业竞争的需求 , 也推动着阿里云去做像CIPU这样的创新 。
比如亚马逊AWS推出了Nitro方案 , 早在2017年时就想用Nitro系统来取代以CPU为核心的计算架构体系 。
从技术原理来看 , Nitro与CIPU类似 , 他们的区别在于 , Nitro将硬件芯片和软件系统集成到了一起 , 其外部形态就是一个盒子;而CIPU则由专用芯片和控制器构成 , 对接飞天操作系统 , 并对其进行管理 。
张建峰在接受媒体专访时表示 , “云计算越来越接近进入下一个时代了——全新的架构定义 , 全新的软件界面 , 硬件加速 。 ”
张建峰讲述了云计算行业当前的现状 , 同时也暗喻着 , 在新一代主流云计算架构没有确定之前 , 这是一个难得的窗口机会 , 一个重新定义云计算的机会 。
举个例子 , 一些做设计的用户在渲染时要用到很高的算力 , 于是会花很多成本用在配置电脑上 , 但如果用到云电脑 , 就可以节省很大一块前期投入 , 此外 , 用户的数据全在云上 , 有加密、熔断等保护机制 , 比存在本地硬盘还要安全很多 。
此外在办公、游戏、娱乐等很多场景中 , 云电脑也都有着自己的独特优势 。
想象一下 , 当我们不再需要物理主机时 , 云计算市场将会发生怎样变化?