可加性|普林斯顿大学王梦迪:从基础理论到通用算法,看见更大的AI世界观( 六 )


王梦迪与团队追求创新研究,探索前人没有涉足过的问题。在她看来,机器学习领域更多基础问题已经解决,但在应用中还有大片空白。比如,在 AI 与生物学、AI与医疗、AI与材料等的结合研究中,学科间的融合是一大难点。
在与跨学科的科学家合作的过程中,王梦迪的一个感受是:两个领域的学者在定义问题的语言与方式上十分不同:
「机器学习的研究者习惯一上来就先问数据是什么、输入输出是什么,而自然科学的科学家可能对『输入』的概念很模糊。尤其是当数据少时,我们会需要对数据进行迁移学习,了解其他关联数据,分析数据之间的相似性,寻找内在逻辑和图谱等等。所以,要设计机器学习算法来辅助science,还要有大量沟通。」
不过,王梦迪并不沮丧。DeepMind是将人工智能应用在科学研究上的领头羊。来自 DeepMind 与其他机器学习领域的科学家的自信也感染了王梦迪:
「DeepMind的价值观就是要推动人类文明的进步。我感觉研究人工智能的学者都非常自信,觉得自己有能力解决世界上最难的问题。这种自信非常棒,会给予自己主观能动性,也会感染其他学者,帮助不同学科的人更快、更好地联合在一起,去解决原先以为难于登天的问题。」
近日,王梦迪与团队在这方面也取得了不错的成果:他们将单细胞的状态(来自于单细胞的逆转因子测序)当成一个系统来进行强化学习建模,通过高通量的单细胞测序数据来重建一个单细胞的状态变化轨迹,甚至找到它的重要隐变量,从而预测干细胞的分化和癌症细胞的病变。他们用深度学习的方法优化碱基序列和蛋白质氨基酸序列,辅助开发新的基因编辑、基因治疗工具。
问及为何「AI for Science」的首选领域是结构生物学,王梦迪解释:主要原因是结构领域的数据相对多;即使没有数据,还可以用分子动力学进行计算模拟。很多AI在药物发现上的突破,即是从这个角度出发,用深度学习进行加速,做泛化性处理。然而在数据量更稀少的问题上,还有大片空白等待探索。
谈起DeepMind,王梦迪非常爱戴,这个由世界顶级科学家创立的科研机构在用 AI 推动科学进步、社会进步的进程上敢为天下先,给全世界的学者带来了信心。但与此同时,DeepMind也无需被过度神化:「单就强化学习的应用技术而言,国内的领头羊,比如腾讯 AI Lab、阿里达摩院、滴滴等,并不比DeepMind差。」
追溯DeepMind发展飞快的更深一层原因,是 DeepMind 的科学家在母公司谷歌的支持下,能够自由地探索研究。相比之下,「国内应该没有一个 AI 机构能像 DeepMind 一样拿到那么多没有限制的资源。所以,从资源投入的角度来看,将任何一个以前的研究机构与 DeepMind 比都是不公平的。」

6、青年学者的乐观主义
王梦迪对人工智能的未来十分乐观。
她认为,机器学习仍在快速发展,当越来越多学科与知识融入其中,也必然产生越来越多的新问题。从这个角度来看,后继者在可以前人的基础上开辟新的道路,深度学习的瓶颈未必是人工智能研究的瓶颈。年轻的科学家们有机会拓展机器学习的边界、甚至科学的边界,在AI的大领域中找到自己的位置。
也许是年龄与所带领的博士生相仿,王梦迪似乎更能理解学生的想法,愿意支持学生做各种各样的选择。无论是进入学术界传承衣钵,亦或进入工业界推动技术落地;是做应用和产品,还是理论研究,她认为,这些方式都能推动人工智能发展,无以臧否。雷峰网
这一点,显然是受到了Bertsekas的影响。在她读博时,导师便从未否定过她的想法,而是支持她做任何事情。