云计算风向标:自研芯片重构云上算力

预言未来最好的方法 , 就是去实现它 。
2017年 , 网易游戏《荒野行动》出海日本 。 2018年 , 这款游戏在日本手游年度收入榜排名第四 , 为网易带来约25亿元收入 。
这个游戏出海成功案例的背后 , 是稳定、响应快、能快速扩展的计算基础设施 。 在国内 , 网易往往自己建设计算基础设施;而在海外 , 则采用混合云 。 通过亚马逊云科技提供的基础服务 , 网易搭建了一个可以快速扩展的云基础架构 , 满足了海外游戏业务快速增长的要求 。
同年 , 亚马逊云科技推出第三代自研的Nitro系统 , 可支持最多8个弹性网卡 , 将网络负载均衡分布到8个CPU内核上 , 计算资源的总利用率提升了一倍 。 使《荒野行动》云计算成本降低了四成;而通过使用AmazonEC2A1实例 , 音频语音服务和网络转发服务的云计算成本节省了一半 。 降低成本 , 提升效率 , 这是云计算的意义所在 , 而这还只是开始 。
01再次突破云技术边界
在2018年 , 亚马逊云科技发布了Arm架构的AmazonGraviton处理器 。 这是亚马逊云科技自研、为云计算而设计开发的芯片 。 2020年Graviton2发布 , 性能比第一代提升了7倍;2021年推出了第三代 , 性能比二代提升四分之一 , 浮点计算性能提高了两倍 。
EpicGames的高级工程总监MarkImbriaco说:「基于AmazonGraviton3的EC2C7g实例适用于最苛刻的延迟敏感型工作负载 , 同时能提供显著的性价比优势 , 并扩展了《堡垒之夜》内的可能性和任何虚幻引擎营造的体验 。 」F1赛车管理公司发现 , C7g实例比Graviton2C6gn实例快40%;Twitter认为基于C7g实例的性能比基于Graviton2的C6g实例高出20-80% , 同时还将尾延迟减少了35% 。
今年 , 正在拉斯维加斯召开的re:Invent2022大会上 , 亚马逊云科技发布了Graviton3E 。 这是针对高性能计算优化的版本 , 面向机器学习浮点和矢量数学计算做了优化 , 在HPL基线测试中 , 工作负载的性能提高35% 。 基于Graviton3E芯片 , 亚马逊云科技推出了面向高性能计算的HPC7g , 适用于天气预报、生命科学、工程计算等高性能计算场景 , 最多可以提供64个vCPU和128GiB内存 。
云计算风向标:自研芯片重构云上算力
文章图片
Graviton并不是亚马逊云科技设计的第一块芯片 。 2013年 , 亚马逊云科技就推出了首颗自研的Nitro芯片 , 意在通过定制硬件 , 降低虚拟化的消耗 , 将更多服务器资源提供给用户 。 这是长期探索后的必然之举 。 2006年 , 亚马逊开始尝试提供云服务 , 起初使用基于Xen架构的虚拟化系统 , 但很快发现这种方式大概只能将七成服务器资源提供给用户 , 而且无法满足用户的稳定性和性能要求 。
Nitro系统的引入 , 提升了计算实例的安全、性能以及创新速度 。 亚马逊云科技在2017年推出了第三代Nitro芯片 , 2020年开始使用第四代Nitro芯片作为所有计算实例的基础 。 经过迭代 , Nitro系统提供输入/输出资源和管理功能 , 包括网络、块存储、安全与虚拟机管理等 。
在今年的re:Invent2022大会上 , 亚马逊云科技高级副总裁PeterDeSantis发布了第五代Nitro系统 , 相比于前一代产品 , 晶体管数量比前一代增加了一倍 , 提供更高的计算性能 , 同时DRAM内存性能提升了一半 , PCle带宽提升两倍 , 降低约三成延迟 , 每瓦性能提高四成 , 网络转发性能提高六成 。 配备Graviton3E和新一代AmazonNitrov5的C7gn实例 , 比C7g网络带宽提升了一倍 , 每秒数据包转发性能提升50% , 为网络密集型工作负载提供了超高的网络带宽、数据包转发性能和性价比 。
云计算风向标:自研芯片重构云上算力