溯因|溯因推理:人工智能的盲点( 三 )


拉森对数据驱动的AI的扩展不屑一顾,认为它“作为一种智能模型存在根本的缺陷”。他重申,尽管搜索和学习都可以提供有用的应用,但其都是基于非溯因推理。
“如果没有一场关于推理的思考革命,搜索将不会扩展到常识或溯因推理,而这还没有发生。与ML类似,学习方法的数据驱动本质上意味着推理必须存在于数据之中,可以这么说,但这显然并不适用于人们日常执行的许多智能推理”,拉森说道。“我们不只是着眼于过去,比如,透过在大型数据集中捕捉到的过去,以得出对未来的结论、思考或推断。”
其他科学家认为,将符号系统和神经网络结合在一起的混合AI在解决深度学习的缺点方面拥有更值得期待的前景。其中,一个例子是IBM的“沃森”(Watson),它在美国最受欢迎的智力竞赛电视节目《危险边缘》(Jeopardy!)击败世界冠军时就出名了。最近的概念验证混合模型在符号AI和深度学习单独表现不佳的应用中显示出了有希望的结果。
拉森认为,混合系统可以填补只使用ML或只基于规则的方法的空白。作为自然语言处理(NLP)领域的研究人员,他目前正致力于将大型预训练语言模型(如GPT-3)与以知识图形式出现的语义网络的旧工作相结合,以在搜索、问答和其他任务上创建更好的应用。
他说:“但是演绎-归纳组合并不能让我们进行溯因,因为这三种类型的推理在形式上是截然不同的,所以它们不会相互还原,也无法结合起来得到第三种。”
在《人工智能的神话》一书中,拉森将试图规避溯因的行为描述为“推理陷阱”。
他写道:“无论计算机的速度有多快,像ML这样纯粹的归纳启发技术仍然存在不够成熟,并且像‘沃森’这样的混合系统也缺乏一般的理解。在诸如需要语言理解之类的开放式场景中,溯因是核心且不可替代的。正因为如此,试图结合演绎和归纳策略的尝试总是注定要失败……这一领域需要一个基本的溯因理论。与此同时,我们陷入了困境。”
人工智能的商业化
AI社区对数据驱动方法的狭义关注已使研究和创新集中在少数几个拥有大量数据和雄厚资金的组织中。随着深度学习成为一种将数据转化为盈利产品的有效方式,大型科技公司现在陷入了聘用AI人才的激烈竞争中,以高薪为诱饵,吸引研究人员走出学术界。
这种转变使得非营利实验室和小公司很难参与到AI研究之中。
拉森说:“当你把AI的研发与非常大的数据集的所有权和控制权联系在一起时,你就会为那些不拥有数据的初创企业设置准入障碍。”并补充说,数据驱动的AI在本质上造成了商业领域“赢者通吃”的局面。
AI的垄断反过来也阻碍了科学研究。随着大型科技公司专注于开发应用程序,利用其庞大的数据资源保持对竞争对手的绝对优势,因此几乎没有动力来探索AI的替代方法。这一领域的研究开始倾向于狭义的、有利可图的应用,从而牺牲了能够带来新发明的努力。
拉森说:“目前没人知道,在不具备如此庞大的集中式数据集的情况下,AI会是怎样?因此,对于那些希望通过设计不同的、更强大的AI来与之竞争的企业家来说,真的没有什么可提供的。”
在书中,拉森对当前的AI文化提出了预警,这种文化“正在从唾手可得的果实中榨取利润,同时继续编造AI神话”。他写道,对通用人工智能(AGI)进展的幻想可能导致另一个AI冬天。
不过,尽管AI冬天可能会减弱人们对深度学习和数据驱动AI的兴趣,但它可以为新一代思想家探索新方向开辟道路。拉森希望科学家在现存方法上进行探索并超越。