规模|做大AI规模的四字秘诀——垂直整合

自2015年左右AI热潮从学术界转向产业界,在近6年的时间里,AI已经越来越多地应用到各个领域,但在实际落地的过程中也遇到了各种挑战,这也导致了过去三两年间,整个业界对于AI的关注弱了很多。
如何实现AI的规模化发展?英特尔研究院副总裁、英特尔中国研究院院长宋继强认为,AI产业创新已经到深水区,要更深入地理解如何利用基于数据驱动的人工智能带来的福利,把产业规模化扩展作为重要发力点。垂直整合、应用驱动是真正可以让AI把算法创新、硬件创新落到实处,并且是形成一个迭代的滚动放大效应的必由之路。
英特尔院士、大数据技术全球首席技术官、大数据分析和人工智能创新院院长戴金权也向雷锋网表示,AI的落地是一个系统工程,AI的数据和模型在不断更新,在落地过程中总是解决一个问题才会有新的问题,解决了关键问题才能实现价值。
先数据,再AI
AI的发展需要算力、算法、数据三大要素。宋继强认为,这一波的AI热潮是由数据驱动的。他在WAIC 2021的演讲中指出:“从量的角度,大量的数据由原来靠人产生,变成由终端、自主设备产生。从质的角度,很多数据不再是结构化数据,也不再是人可以根据固定的数据结构产出,然后用编程去处理,必须依靠AI算法去处理。”
规模|做大AI规模的四字秘诀——垂直整合
文章插图

戴金权进一步从大数据的角度说明了为什么业界需要AI。从2006年处理大数据集的Hadoop开源,业界最早关心的是如何存储处理更多的数据。这个问题后,下一个问题是分析数据,再之后的关注点是数据实时分析。
发展到今天,关注的重点变成了如何在数据上建模、做预测,通过机器学习、深度学习等指导决策或预测未来的趋势。所以,大数据AI软件平台成为了解决大数据发展的关键。
“经过过去十多年数据的积累,许多企业在数据的架构,以及数据平台上已经积累了一定的能力和数据资产。这时候,他们在现实场景有非常多的应用需求要提升效率,更好的AI软硬件平台能够帮助他们提升效率,所以越来越多的公司开始使用大数据AI。”戴金权表示。
但AI的应用面临重重挑战,第一个问题是否有数据,以及数据是否有标签。有了数据,需要明确要解决的问题。但这还不够,在这个基础上,要做一个实际落地的项目,需要把算法和大数据系统打通。
“很多时候,算法和大数据系统其实是割裂的,只有解决割裂的问题,才能构建出端到端的模型。还有,日常运行的过程中,不断会有数据和模型的更新。”戴金权指出。
“实现AI的必由之路就是超异构计算,也就是英特尔一直提的XPU战略,用不同的架构处理不同类型的数据,根据处理速度的要求、带宽的要求去优化。”宋继强表示。
那什么是超异构?异构是一个很早的概念,如今已经比较常见的SoC就是一个异构的系统,包含CPU、GPU、DSP等IP。还有一种常见的异构是板级异构,将CPU、GPU、FPGA等集成到一块电路板上。
“超异构计算是要体现出它是‘下一个等级’。在一个异构系统中,许多人都忽略了软件层,但事实证明如果软件层没有优化好,底层的硬件再强大也意义不大。所以超异构的‘超‘意思是要把封装能力考虑进去,同时要考虑软件。”宋继强解释。
规模|做大AI规模的四字秘诀——垂直整合
文章插图

硬件超异构
在这一轮的AI浪潮中,可以看到算法不断驱动硬件性能的提升,有时甚至成为AI快速提升的阻力。此时,已有处理器性能的提升和计算架构的创新都非常关键。CPU是英特尔的看家本领,为了满足AI的需求,英特尔的CPU也采用了异构的方式,在至强处理器中加入了专门的深度学习加速器件,还有可扩展的一些配置。集成AI的至强处理器让通用服务器性能已经提升了46%,AI性能提升了74%。