删除|如何赢在混合云与计算时代?解读英特尔再度回归芯“智”向( 四 )


黄博远介绍 , 推荐系统具有极大的商业价值 , 但推荐系统的深度学习模型面临着几大挑战:首先是模型特征值的处理 , 由于推荐模型特征值的变化非常快 , 需要动态处理而无法像传统深度学习训练那样等一周或一个月才能训练出一个模型;此外 , 由于超大规模的模型 , 在训练过程中会遇到构建分布式框架、Runtime和编译的优化、图优化、算子优化等一系列的问题 , 而这一切优化都需要上层软件与底层硬件以及硬件厂商提供的算子库进行深度合作 , 因此PAI平台选择与英特尔合作对DeepRec进行优化 。

魏彬介绍 , 英特尔与阿里巴巴PAI机器学习平台团队合作 , 为DeepRec完成了大量的优化 , 包括沉淀了大量算子优化、图优化、Runtime优化、编译优化 , 并基于硬件实现了深度定制优化 , 支持高性能分布式训练 , 在稀疏模型的训练方面有着优异的性能 。 例如:在算子优化方面 , 针对稀疏模型的典型算子优化 , 充分利用AVX512、BF16指令加速 , 还将大矩阵进行分块 , 提升cache命中率 , 减少访存开销 , 实现算子加速2-6倍;在框架及库优化方面 , 整合了最新的英特尔oneDNN加速库 , 实现线程池调度优化 , 获取最佳性能 , 还基于PEME持久内存进行优化等等 。
目前 , 英特尔正与阿里巴巴合作 , 推动DeepRec的开源 , 从而造福整个生态 , 让更多的客户可以获得与阿里巴巴同样性能的推荐系统 , 进而在发展数字化业务中占得先机 。
【全文总结】从2021杭州云栖大会英特尔论坛 , 可以看出英特尔面向未来数字化场景进行底层硬件和芯片级创新的决心和能力 。 英特尔通过与阿里云这样的世界顶级云服务商合作 , 打开了从“芯”创新的思路与方向 , 同时在实际的超大规模业务打磨中 , 锤炼了从底层芯片到上层应用软件的一体化创新与优化能力 , 找到了制胜混合云与计算时代的路径 。 因此 , 混合云与计算时代 , 英特尔可期!(文/宁川)