刚获ICML大奖的机器学习大牛Max Welling加入微软,主攻分子模拟( 三 )


ChrisBishop也列举了微软研究院在药物挖掘领域所做的努力 , 比如与药物公司展开积极合作、研究机器学习如何影响药物发现过程等等 。 微软研究院一直在做的很多工作都用到了由实验数据驱动的机器学习 , 并且致力于从蛋白质分子折叠以及与其他蛋白质相互作用的量子物理学第一原理模拟中创建数据 。 此外 , 微软研究院还对药物发现和更广泛的生命科学领域感兴趣 , 如对COVID-19的研究 。
ChrisBishop还提到 , MaxWelling最出名的工作是在机器学习中研究不变性(invariances)和等变性(equivariances) 。 这些又与分子模拟遇到的挑战存在哪些关系呢?
MaxWelling解释说 , 在物理学中要考虑对称性 , 几乎所有的物理学理论都是围绕对称性建立的 。 事实上 , 整个标准模型都是由粒子组成的 , 粒子是根据对称变换来组织的 。 他和同事也想在神经网络中实现这一原则 , 事实上卷积神经网络在某种程度上已经实现了 。
「神经网络大体上有这么个想法 , 如果你把一只猫从一个地方移到另一个地方(translation) , 神经网络的输出要么是不变的(invariant) , 即猫还是猫;如果你在图像左边或右边看到猫或者对它做图像分割 , 则分割mask应随着猫移动(equivariance) 。 我们在思考如何扩大这些原理的应用范围 , 比如将物体旋转 , 预测结果应该还是不变的(invariant) 。 颠倒的猫终究还是猫 , 对吧?这对于分子模拟来说尤其重要 , 因为如果你旋转一个分子 , 你仍然会认为它的性质和你在其他方向看到它时的性质是一样的 , 并且把这个归纳偏置 , 即先验知识 , 构建到你的模型中 , 这就是我们最近一直在做的 。 我们把它构建成所谓的图神经网络 , 你可以把原子看作是图中的节点 , 而原子之间的相互作用是边 , 这些原子互相发送信息 , 这和做卷积很相似 。 所以 , 在那个图神经网络中 , 我们让它们在经历旋转后保持某种对称 , 然后用它描述分子 , 这是非常成功的 。 有趣的是 , 你可以通过数据集来预测这些分子的性质 , 而这些预测是惊人的准确 。 现在 , 整个社区开始意识到这一领域在未来可能产生重大影响 。 」
两人在对称性将在机器学习领域扮演重要角色这一点上达成了一致 。 那么 , 量子计算又会对分子模拟产生哪些影响呢?
MaxWelling认为 , 分子本质上属于量子系统 , 特别是电子通过量子力学得到了很好的描述 。 量子计算机在某种意义上也是一种自然的量子模拟 。 我们可以将量子计算机看作某种量子实验或者量子模拟 。 人们认为第一个实际的量子计算应用将出现在模拟量子力学领域 。 现在 , 量子计算仍处于初步阶段 , 真正可用的量子计算有希望在10多年后出现 。 现阶段 , 我们可以首先使用一些噪声更多的量子设备 , 利用量子计算来建模分子 , 其中量子计算与机器学习的协同合作最令人兴奋 。
除了探讨机器学习、量子计算与分子建模的技术融合以及发展前景之外 , 两人还就阿姆斯特丹实验室的一些情况做了分享 。
MaxWelling表示阿姆斯特丹是一座适宜居住和工作的城市 , 人才交流频繁 。 实验室将招聘优秀的研究人员 , 组建一支多样化的团队 , 并与剑桥实验室团队展开合作等 。 未来几年 , 他希望可以构建一个预测分子特性的系统 , 可以生成具有某些特性的分子 , 以及在巨大的空间中搜索这些分子 。
未来10年 , MaxWelling希望可以解决「理解分子」的问题 , 并能够即时设计新材料 , 比如设计新的催化剂来赋能绿色经济 。 他还希望能够为现在无法治疗的各种疾病设计新药 。