研究院|专访张宏江:撑开深度学习瓶颈,中国也有做出国际顶尖研究的环境

机器之心原创
作者:闻菲
张宏江认为,智源研究院将人工智能领域的优秀人才聚在一起,探索并成功找到一个能够产生原始创新与长期影响的领域,即超大规模预训练模型;智源将围绕「悟道」巨模型构建生态系统,一方面不断去撑开深度学习的瓶颈,更重要的是这个探索表明,在中国同样有开放、自由、足以做出全球顶尖研究的环境。
在计算机科学乃至整个人类发明史上,贝尔实验室都是一个传奇。那里诞生了晶体管、C语言、Unix 操作系统,开创了信息论这个新的研究领域。
另一个例子是施乐 PARC,那里制造出了全球第一台带有图形用户界面的计算机、第一个局域网、第一个「所见即所得」文本编辑器……这些,还有其他的伟大发明一起,奠定了如今我们所熟知的计算机生态体系。
但贝尔实验室和施乐 PARC 的荣光并没有持续,在上个世纪一段并不长的时间里,美国的大型综合实验室作为创新的发动机,将科学研究、技术转化和经济发展完好地结合在了一起。在新的时代背景下,如何借鉴其优点并规避其缺陷,是任何一家科研机构负责人都需要思考的问题。
张宏江尤其。2018 年 11 月,他正式出任北京智源人工智能研究院(以下简称「智源研究院」)理事长,继参与创立微软亚洲研究院、创立微软亚洲工程院、担任微软亚太研发集团 CTO 和金山集团 CEO 之后,再度执掌一家以研究为一大核心使命的中心。
在微软的 12 年里,张宏江和他的同事们在中国创建了一座世界一流的企业研究院和一所全球领先的高水平核心软件产品研发机构。在金山的 5 年里,他帮助这艘中国本土软件行业的旗舰完成了移动互联时代的成功转型。因此,不难想象有很多双眼睛都在看着,加入智源研究院的这段时间里,张宏江和他的团队都做了些什么。
作为依托北京市科委和海淀区政府成立的新型 AI 研发机构,智源研究院确立了三项重要任务:一是构筑一个社区;二是打造一个真正适合青年科学家成长的平台;三是专注于一些可能产生原始创新与长期影响的领域,包括过往投入不足、重视度不够的领域。
在 2021 年 6 月 1 日举行第三届智源大会上,张宏江接受了机器之心的专访。随着会上悟道 2.0 巨模型的发布,他认为智源研究院成立两年多以来,通过「智源模式」成功聚集起一批优秀的青年科学家,初步建立了社区,并将「大模型+大算力」明确作为探索通用人工智能的路径之一,而 AI 大模型不仅本身是一个可能产生原始创新与长期影响的领域,还将成为一个平台,催生更多世界级的成果。
更重要的,张宏江指出:「我愿意将悟道 2.0 视为北京乃至中国人工智能发展的一座里程碑,它的成功表明,在中国同样有能够做出全球顶级研究的环境。」
张宏江领导下的「智源模式」究竟为何?智源研究院将如何产出具有深远影响的原创性研究?将众多优秀青年人才聚集在一起,我们未来能否看到一个新时代背景下具有中国特色的贝尔实验室或施乐 PARC,并且自身可持续?
把优秀的人聚在一起,自然会产出有影响的成果,甚至开创新的领域
1993 年 1 月,张宏江以第一作者的身份在同行评议期刊「Multimedia Systems」的创刊号上发表论文「Automatic partitioning of full-motion video」,这篇文章建立了现代视频检索和内容查询的一个基本框架,成为现代多媒体研究领域的经典文献之一。不久后,他还开发出一套视频检索系统并在美国取得专利,这项专利被柯达、英特尔等知名公司购买,广泛用于各种产品和研发中。
得益于多项这类基础性、框架性的工作,张宏江在 2010 年和 2012 年先后被计算机科学领域的国际顶级学会 IEEE 和ACM SIGMM 授予「技术成就奖」(Technical Achievement Award),分别表彰其在多媒体内容分析系统方面开创性的贡献,以及在多媒体计算、通信和应用领域「重大而持久的贡献」。