图灵奖得主杨立昆:我如何走上人工智能之路丨展卷( 五 )


在莱苏什 , 我是年龄最小的与会者之一 , 我当时刚开始着手写博士论文 。 令我无比紧张的是 , 我需要在众多享誉业界的大咖面前 , 用英语做一个关于多层网络和HLM算法(反向传播的前部研究)的英文报告 。
尤其有两位听众给了我巨大的压力:一位是贝尔实验室的部门负责人拉里·杰克尔(LarryJackel) , 后来我很荣幸地加入了他的部门;另一位是该部门的二号人物约翰·登克尔(JohnDenker) , 他是一位来自亚利桑那州的真正牛仔 , 身穿牛仔裤和牛仔靴 , 有着垂到脸颊的头发……这位刚刚完成博士论文的“非典型研究人员”拥有令人难以置信的强大气场!当某位研究者发言之后 , 他能够很快就议题展开讨论 , 表明自己的观点 。 他谈话时虽没有攻击性 , 却掷地有声 , 有理有据 。 当然他的自信也是有缘由的 , 弗朗索瓦丝·福热尔曼曾说:“贝尔实验室的研究人员有着巨大的优越感 。 当你要研究某个课题时就会发现 , 要么贝尔实验室早在10年前就已经研究过了 , 要么已经证明这条路行不通了 。 ”简直太可怕了!
我做完了关于多层网络和HLM算法的报告 , 与会者中真正听懂的人寥寥无几(这已经让我够紧张了!) , 然后 , 约翰·登克尔举起了手 , 我简直紧张到窒息!但他在所有听众面前对我说:“讲得真的很好!谢谢您 , 让我知道了很多事情……”我确信我的名字已经留在他和拉里·杰克尔的脑海中 。 一年后 , 他们邀请我去他们的实验室做报告 。 两年之后 , 我接受了贝尔实验室的面试 。 三年后 , 我正式加入了他们的团队!
同样是在莱苏什 , 我碰到了特伦斯·谢诺夫斯基 , 也就是与杰弗里·辛顿共同发表关于玻尔兹曼机的文章的作者 。 他是在我完成报告后到场的 。 我在下午的茶点时间找到了他 , 向他阐述了我在多层神经网络方面的工作 。 在交流之前 , 我并不确定他是否会感兴趣 。 他只是耐心地听着 , 并没有告诉我他与杰弗里·辛顿也在进行反向传播研究 , 也没有告诉我 , 辛顿已经成功实现反向传播 , 只不过没有对外公布而已 。
伟大的发明之间能够相互启发 。 辛顿的研究就使用到了加利福尼亚大学圣迭戈分校的戴夫·鲁梅尔哈特的思路 , 辛顿在之前的几年里曾跟随戴夫读博士后 。 1982年 , 戴夫提出这个方法并编写了程序 , 只可惜没能成功运行 。 他找到辛顿 , 辛顿说:“失败的原因出在了局部一些极为细微的问题上 。 ”(参见第四章“多个谷底的困扰”)后来 , 戴夫放弃了 。 但是 , 在研究玻尔兹曼机的过程中 , 辛顿意识到问题并没有自己当初想象的那么严重 。 因此 , 他用LISP语言在Symbolics公司的LISP机器上用戴夫的方法重新编写了程序 , 这一次程序成功运行起来 。
因此 , 在我们交流的过程中 , 特伦斯很快注意到我的HLM方法和反向传播非常相似 。 他没有告诉我 , 在反向传播成功后 , 他已经在研究此后几个月将会风行一时的实际应用了 。 特伦斯回到美国后向辛顿提到了我:“法国有个孩子在进行跟我们同样的研究!”
同年春天 , 我写了第一篇关于自己研究成果的文章(我承认 , 这篇文章离科学文献的标准有点远) , 并在1985年6月举办的Cognitiva大会上将其公开 , 那是法国第一次召开集合了人工智能、神经网络、认知科学和神经科学的综合性大会 。 杰弗里·辛顿是当时的主讲嘉宾 , 他在开幕辞上介绍了玻尔兹曼机 。 结束后 , 将近50个人聚集在他的周围 , 我也想上前交流 , 但并没有机会靠近他 。 随后 , 我注意到他转向其中一位会议组织者丹尼尔·安德勒(DanielAndler) , 并问道:“你认识一个叫杨立昆的人吗?”丹尼尔开始四处观望 , 我立马大喊道:“我在这儿 。 ”其实 , 辛顿已经在会议论文集上看到了我的文章 , 虽然他不精通法语 , 但依然看懂了文章的内容 , 他意识到我就是特伦斯提过的那个“孩子” 。