删除|如何赢在混合云与计算时代?解读英特尔再度回归芯“智”向( 三 )


对于第二个方向 , 用傲腾持久内存加速KV存储是一个典型的场景 。 KV存储是云上很多应用的基础 , 例如阿里DeepRec推荐系统的参数就采用了基于傲腾持久内存的KV存储 , 实现存储加速 。 其它还有由英特尔支持的开源PMEMKV存储、KVDK开发工具 , 以及由Facebook开源的RocksDB等 。
唐湘华从产品落地层面 , 介绍了阿里云基于持久内存的云上创新实践 。 阿里云在很早之前就已经开始投入探索研究持久内存 , 阿里云是全球第一家基于持久内存推出云服务器的厂商 , 早在去年10月份就发布了第一款的持久内存实例 。 经过去年一年的沉淀和打磨以及底层硬件架构的迭代 , 阿里云在今年对持久内存实例进行了全面的升级迭代——最新持久内存实例基于阿里云第三代神龙架构以及英特尔最新第二代持久内存BPS , 相比上代产品的IO能力实现了翻倍、算力提升40%以上 。
在产品层面 , 阿里云在今年进行了大胆创新 , 基于持久内存推出了高端本地盘实例产品i4p , 相对于传统的NVME本地盘实例 , 实现了根本性的性能提升 , 特别是高端本地盘的读写延时可以低至170纳秒级别 , 而传统NVME在10-30微秒左右 , 因此性能提升将近100倍以上 。 此外 , 高端本地盘的单盘IOPS高达140万以上、单盘吞吐高达9GB/s , 相对NVMe也有数倍的提升 。 由于高端本地盘在性能上的绝对领先 , 对于重IO的客户应用场景来说 , 是极大的福音——传统因为NVMe SSD性能不足带来的性能瓶颈问题 , 在高端本地盘上得到了有效的解决 , 例如RocksDB数据库性能提升2.5倍、Click House数据库性能提升2倍、NSQ消息中间件业务恢复时间提升2-3倍、重IO应用延时和抖动得到有效抑制等 。

此外 , 阿里云还持续挖掘持久内存在内存方面的特性 , 与i4p同步推出了基于持久内存的内存型实例r7p和re7p 。 对于需要消耗大量内存的客户来说 , 用持续内存取代内存就可以马上获得成本的收益 。 因为大容量内容非常贵 , 而且目前业界没有其它云服务商可以提供小规格大容量配比的实例 , 因此无法无限扩充内存 , 而只能在性能与成本之间进行折中 。 阿里云看到持久内存可以解决这个问题 , 特别是一些应用经过了特定的改造 , 可以在性能几乎无损的前提下 , 让客户获得纯成本收益 , 例如redis、Parameter Server等应用都可以达50%以上性价比提升而且应用部署非常简单 , 目前已经有很多阿里云客户的应用跑在了持久内存上 。
面对云上层出不穷的应用 , 英特尔持久内存也不断创新:第三代产品正在开发过程中 , 将有性能方面的极大提升;第四代产品采用了CXL接口 , 可以直接插在PCI-E总线上 , 与内存一起进行扩展 。 对于处理器核心数目的不断增长 , 大内存需求将得到充分释放;而网络性能的增长则要求更高性能、更高寿命的存储——这些都是持久内存发挥重要作用的创新场景 。 英特尔为了推广持久内存 , 还推出了相应的应用开发编程书籍 , 帮助更多开发者利用持久内存进行创新 。
智在此芯、软硬兼施DeepRec大规模稀疏模型训练引擎是英特尔与阿里巴巴合作的领先AI工程化系统 , 这是一个基于TensorFlow的推荐引擎 。 众所周知 , 在阿里巴巴的业务场景中有大量的推荐系统 , 而推荐系统的特征值十分稀疏 , 特别适合英特尔技术 。 DeepRec作为阿里巴巴集团稀疏场景的统一训练引擎 , 由集团多个团队合作共建 , 从2016年深耕至今已经支持了淘宝搜索、推荐、广告等核心业务 , 同时也为阿里云客户的推荐业务提供服务 。

由于阿里巴巴推荐系统的特征值往往十分巨大 , 动辄达到百亿、千亿、万亿甚至十万亿的超大规模 , 那么如何基于阿里机器学习平台PAI和英特尔技术 , 实现业务的高效落地 , 就成为双方要共同解决的挑战 。 英特尔中国区超大云计算软件架构总监魏彬与阿里云智能高级产品专家黄博远在2021杭州云栖大会英特尔论坛上 , 介绍了双方围绕DeepRec引擎所做的努力 。