CPU处理器|阿里云首发CIPU处理器 为OS反向自研

阿里硬件研发,又有大动作 。
刚刚,阿里云正式对外发布全新处理器:CIPU 。
不仅架构全自研,还号称要“替代CPU成为新一代云计算核心硬件”!
CPU处理器|阿里云首发CIPU处理器 为OS反向自研
文章图片

云计算搞了这么些年,CPU在数据中心可一直还是牢牢占据“C位” 。
就在去年,阿里还花大力气推出了5nm的服务器CPU倚天710 。
这怎么就突然要打破传统了呢?
CIPU,这个比CPU多了一个I的新面孔,究竟什么来头?
CIPU究竟是什么?
CIPU全称Cloud Infrastructure Process Units,意为云基础设施处理器 。
从名字上就能看出,这是一颗云端处理器,专门用于连接服务器内硬件和云上虚拟化资源 。
CPU处理器|阿里云首发CIPU处理器 为OS反向自研
文章图片

△CIPU架构图
据阿里云介绍,之所以用CIPU取代以CPU为核心的架构,就是为了更好地“压榨”服务器硬件、获取更多虚拟化资源,并让已有的资源用起来更顺手 。
软件上,CIPU接入飞天云操作系统,更高效地完成虚拟化资源编排调度的工作;
硬件上,飞天操作系统通过CIPU能快速云化管理数据中心物理设备,并对网络和存储硬件进行加速,这样一来不仅不会再浪费CPU的算力,还能增强网络和存储性能 。
从功能来说,它拥有四大特性:
云原生最佳载体,即每个裸金属系统能运行2000个容器,并用沙箱容器技术为容器提供更安全的隔离,链路启动速度在50ms以内;
芯片直接实现IO引擎,其中存储I/O操作每秒可进行300万次,网络I/O最高每秒5000万个分组数据包,存储长尾时延降低50%;
芯片级安全加固,即能高速卸载加密后的数据,将芯片级硬件的不可篡改性映射到软件上;
增强型融合网络,即在RDMA技术加持下,网络延迟最低达到5微秒,带宽最高能达到200GB 。
从性能来说,它又给计算、存储和网络三类资源带来了不少提升 。
CPU处理器|阿里云首发CIPU处理器 为OS反向自研
文章图片

计算上,CIPU能快速接入不同类型资源的神龙云服务器,单容器虚拟化消耗减少50%,启动速度快350% 。以运行部分数据库和服务器为例,Nginx性能就提升了89%,Redis提升68%,MySQL提升60%,此外对于AI和大数据场景也有提升 。
存储上,CIPU能对存算分离架构的块存储接入进行硬件加速,存储时延最低达到30微秒,带宽最高200Gbps,支持云上多计算节点NVME共享访问云盘块存储,Oracle RAC、SAP Hana等高可用数据库无缝上云 。
网络上,CIPU对高带宽物理网络进行了硬件加速,基础带宽达到200GB,并采用自研的RDMA-Solar协议,网络时延降低至16us,相较自建物理机的集群吞吐量提升30%、业务高峰期延迟下降90% 。
【CPU处理器|阿里云首发CIPU处理器 为OS反向自研】有意思的是,阿里云这款CIPU处理器,其实已经在内部打磨好几年了 。
它最初的“灵感”,来自于阿里云内部一个叫做神龙卡的设备 。
神龙卡诞生于2017年,从功能上来讲有点类似于AWS发布的一款名叫Nitro的平台(集成了虚拟机监视器、带外管理等功能),甚至比AWS发布的时间更早一点 。
经过了好几轮迭代后,神龙卡逐渐加入了编排调度、硬件加速等更多能力,最终诞生了CIPU的雏形,随后也在继续完善这一款产品 。
一方面,据阿里云智能云架构总监黄瑞瑞介绍,在这几年里,CIPU已经承受过像“双十一”这种体量的性能&压力“测试”了 。