规模|做大AI规模的四字秘诀——垂直整合( 二 )


创新的计算架构能够满足更高的AI需求,比如神经拟态计算,也叫类脑计算。神经拟态计算最大的优势是能效比,比如原来可能需要两千瓦的电才能处理的任务,使用神经拟态计算芯片只需要几十毫瓦或者几百毫瓦,整体的效率是现在深度学习加速芯片的1000倍,符合绿色可持续发展的需求。
但传统以及新型处理器的计算能力提升后,随之而来的是更多的数据交互,包括处理器之间以及跨服务器节点。此时,I/O就成为瓶颈,这种瓶颈包括尺寸和功耗。
“我们认为光是替代铜的非常好的互连的介质,但光器件体积比较大,光电转换也比较困难,效率不高。英特尔从几个方面解决这个问题,首先是把光器件与电器件紧密的封装在一起,让它们靠近,减少两端转换的损耗;其次是制作收发器,以更小的模式放到服务器当中。”宋继强表示。
计算和I/O的问题解决之后,要实现不同类型的处理器、存储器件的异构集成,就需要先进封装技术。在这一技术领域,英特尔有EMIB 2.5D的封装技术。用一个形象的比喻解释这种技术,就像在两个平房间去嵌入下水管道将它们连通起来。
“如果想更好地利用三维空间,就可以在多层上把计算的晶圆互连。英特尔的Foveros 3D封装技术的优势是可以实现计算晶圆间的互连,而不只是在计算的晶圆和存储晶圆之间互连,可以让很多新的芯片很好地进行互连,包括英特尔最新架构的类脑芯片也可以和传统的CPU、GPU互相组合。”宋继强指出。
硬件实现了异构,还需要软件发挥异构硬件的优势,才能实现超异构。对于现在的软件开发者来说,大都只熟悉CPU、GPU或FPGA的开发模式,硬件的异构集成,让开发者很难发挥XPU的硬件优势。
宋继强介绍,英特尔的方案是,联合企业合作伙伴一起推出了开放的软件平台oneAPI,这个平台是一个开放的产业联盟,有四五十家企业和大学都在联盟里。软件开发者来只需要学习Python或者是只学C++,通过oneAPI就可以利用到异构集成的优势,M种硬件和N种性能库和结合将会是M乘以N的倍数提升。如果未来硬件升级替代,软件也只需要少量的改动就可以发挥硬件升级带来的提升。
规模|做大AI规模的四字秘诀——垂直整合
文章插图

【 规模|做大AI规模的四字秘诀——垂直整合】AI方案垂直整合
对于企业来说,如何利用两个割裂集群的工作流,实现效率的提升是非常大的问题。“我们希望通过Analytics Zoo,把一个割离的架构或者是割离的工作流统一在一起。有了统一的大数据AI集群,就可以在集群上直接处理数据仓库中的数据,然后进行大规模分布式数据处理,在这个基础上运行各种AI算法。”戴金权说。
实际上,英特尔2018年推出开源软件Analytics Zoo的第一个版本时,要解决的是如何在大数据平台上把深度学习的算法无缝的进行分布式扩展,这时候BigDL、OCR都可以用于解决这一问题。
“当用户需要把AI落地时,解决了扩展的问题之后,如何更加自动化、更高效地处理数据和建模,需要AutoML的支持。比如一些时间序列分析,可以利用AutoML,实现从数据的处理,包括产生的特征,特征选取,再到模型选取,模型参数调整的端到端平台。”戴金权介绍。
韩国最大电信公司SK电讯就通过与英特尔的合作,就是通过时间序列分析,垂直整合实现效率提升的典型例子。SK电讯需要对4G、5G基站进行网络质量的监控、预测、报警灯工作,而一个城市中可能有几十万甚至更多基站,借助人工显然不能实现很好地监控。为此,SK电讯使用Analytics Zoo构建了一个时间序列的处理分析,将数据处理,深度学习的训练、推理、使用构建了一个统一的流水线,运行在统一的大数据Spark集群上。