研究院|专访张宏江:撑开深度学习瓶颈,中国也有做出国际顶尖研究的环境( 三 )
「我一直相信大模型本身会成为一个平台,这也是我们要围绕它建立生态系统的一个核心原因。」张宏江语气笃定。
如果将 AI 比作电力,那么大模型则相当于「发电机」,能将智能在更大的规模和范围普及。研发发电机乃至构建发电厂,需要团队协作,而且最好是由跨领域的小团队组成的大团队来完成。事实也证明,与小型研究团队相比,大型研究团队更擅长完善创新。
但「完善创新」并不等同于简单的打补丁。智源研究院学术副院长、悟道项目负责人清华大学教授唐杰告诉机器之心,悟道巨模型正在从应用层面拉动从底层硬件到操作系统,再到智能软件一整个生态的变革和演进:底层硬件方面,包括训练使用什么类型的芯片、探索新的体系结构,甚至如何构建未来的智算中心;在模型层面,不断增大的规模也带来了全新的发现。「我们在大模型的尺度上观察到了在以往小模型上看不到的现象,」唐杰说:「比如悟道 2.0 可以从零开始,从大量的数据中自动学习出一些知识。」
文章插图
在悟道2.0的发布会上,所有参与者的名字都被列了出来。来源:智源研究院
科学 ≠ 技术,量化容易导致短期行为,让研究人员无心聚焦真正有价值的问题
目前,悟道团队正在努力构建一个平台供外界使用,并根据反馈再做改进。而这引出了科研管理的另一个关键问题——如何在赋予研究人员足够多自由的同时,确保他们的研究能够产出切实可用的成果?
智源的方法依然是小同行自治。各研究小组内会有频繁的不定期会议,虽然是非正式的讨论,但这样的交流对学者而言却更具紧迫感和约束力。就好比跟导师说月底交论文初稿是一回事,但月底在一众小同行面前公开分享论文完全是另一码事。
至于研究人员的考核,身为科研管理者的张宏江「最不喜欢『量化』」,他认为科研是创造性的工作,对创造性工作进行量化评估,容易导致短视、走偏等一系列问题。
「不仅如此,频繁的量化还会分散科研人员的心力,而这或许更加致命。试想,当你每年必须要发 10 篇论文,你首先去想的,或者说占据你大部分心思的,就成了哪 10 篇论文更容易发表,而不是去思考真正有价值、有意义的问题。」
将 99% 的精度提升为 99.1%,有没有意义?有,但意义大不大?这就难说了。在他看来,太多聪明的人之所以没有成功,就是因为他们将心力花在了不断去完善一个已经被解决的问题。
真正优秀的工作需要时间,也需要时间去证明。如今大热的深度学习,理论突破发生在上个世纪,很多研究的影响需要十年甚至二十年才开始显现。
「投钱给科学是做公益,不能功利。」张宏江说。
科学 ≠ 技术,那些真正善于研究的人,根本不关心产品,也不关心市场,他们甚至不在乎任何意义,只是单纯的好奇。「一旦设定了考核指标,就有了功利,而一旦追求功利,有了『心魔』,反而难出成果。」
所以他讨厌「量化」。一年发 10 篇论文的人一定比不发论文的人强吗?完全可能是后者对于发论文的自我要求更高而已。一篇被引用了 100 次的论文一定比只有两三个引用的论文更有真知灼见吗?首先要看这些引用来自哪里。
在评估智源团队的研究工作时,张宏江看重的是同行的认可,尤其是领域公认的牛人的认可,以及其他人对研究成果或想法(idea)的关注和应用。例如,悟道 1.0 公布时,无论是学术界还是产业界,大家更多都处于观望状态,而悟道 2.0 甫一发布,就有不少公司主动问询并表示想要参与,甚至愿意投钱,这就是其影响力和价值的一个很好证明。
- 腾讯研究院|构建美好数字社会,腾讯2022科技向善创新周成功举办
- 中国信息通信研究院|5亿5G终端,有你一份吗?
- 山东省工信厅|山东未来网络研究院建成全球首张5600公里确定性网络
- 中汽数据|吉利研究院、腾讯云、中汽数据、安恒信息签署战略合作
- 算法|腾讯研究院发布《可解释AI发展报告2022》 探讨AI伦理走向
- 12月30日|会员资讯 | 人民网专访“大国新风”BRI呼博士,探索行业高质量发展
- 中国信息通信研究院前不久发布的《全球数字经济白皮书》显示:未来10年|国美搭建六大平台,正是从需求端启动的一场变革
- 4k|专访安霸中国区冯羽涛、郄建军:芯片融合是未来安防必然趋势
- 小米AI实验室入选《麻省理工科技评论》中国“2021人工智能创新研究院”
- 专访中国传媒大学卢迪:5G消息,银行进入智能化时代的新入口