重庆大学刘礼:因果学习与应用( 二 )
这套体系也有可能出错 , 例如牛顿定律在地球上适用 , 但在宇宙中就失效 , 从而爱因斯坦提出了相对论 。
东方科学发展也有几千年 , 也大量地研究过因果关系 。
1
超越数据驱动 , 迈向可解释性
主流数据驱动的机器学习已经非常成功 , 无论是阿法狗 , 还是GPT都带来了惊艳的效果 。 但有两个缺点:没有可解释性、可控性差 。
文章图片
为了解决上述问题 , 图灵奖获得者朱迪亚·珀尔提出因果关系之梯 。 如上图 , 第一层次是关联 , 通过概率表达描述出观察到的一堆数据 。 第二层次是干预 , 不仅是观察 , 而且是进行实验改变 , 例如如果吃了阿司匹林 , 我的头痛会得到治愈吗?如果我们禁止吸烟将会发生什么?其中 , 吃药和禁止吸烟都是干预手段 。 第三层次是反事实 , 在既定结果已经发生的情况 , 假设当初采取另一方案 , 则会发生什么 。 反事实不会得到观察数据 , 毕竟不存在两个平行世界 , 但确实经常遇到的情况 , 经典的就是人们常说的“如若当初........就不会......” 。
文章图片
在概率空间层面 , 如何解释?如上图 , 观察到的数据 , 形成一个联合分布概率表达;加入干预之后 , 每一个操作对应一个概率分布 , 因此可能解决“独立同分布”假设带来的缺陷 。
文章图片
反事实问题目前非常难解决 , 也有很多例子 。 黑人被警察控制事件 , 反事实下 , 就对应:如若白人被警察控制了 , 会发生什么?在影视剧中 , 也常发出如若是另外某个明星参演 , 票房会有什么变化 。 这些反事实问题没办法验证 , 但需要回答 。
文章图片
针对此问题 , 目前有两套主要的因果模型:Pearl的结构因果模型;Rubin的潜在结果模型 。 两者都可以预测、干预以及回答反事实问题 , 对于“发现定理知识”目前还不确定是否可行 。 但潜在结果模型的不同之处在于 , 可以从数据中学习 , 但与现有知识相结合比较困难 , 而结构因果模型则相反 , 可以结合现有知识 , 但从数据中学习的能力还亟待进一步检验 。
目前 , 因果范式有几个问题正在解决:因果发现、因果推理 。
因果发现需要基于已有的数据找出变量和变量之间的因果关系 。 目前有两套主流的方法:基于约束以及基于评分的 。 这两套方法不去详细讲述 。 但存在的问题是:随着变量的增多 , 需要检验因果图就会达到天文数字 。 因此 , 如何利用机器学习方法反过来提升因果发现 , 是目前流行的问题 。
在机器学习领域中 , Pearl的方法本质是基于结构方程 , 主流方向是用它进行因果解耦 。 同时 , 也有一些非因果的方法 , 例如在SVM空间中进行超平面切分 。
文章图片
在因果推理层面 , Pearl提出了do算子 , 在因果图上给出了一系列定理和假设 , 用传统的概率表达形式进行操作 , 这就让“因果”变得可计算 。 Pearl同样给出了反事实计算框架 , 其最重要的是“孪生网络” , 包含一个真实世界 , 以及一个反事实世界 。 Pearl这套理论其实也存在缺点 , 即假设因果图是存在的 , 并需要包含一些先验知识 , 例如方程的结构是线性还是非线性的 。
- 清华大学|中国工程院院士李三立逝世:曾研制2台世界500强超级计算机
- 纳米|清华大学重大突破,实现小于1纳米晶体管,外媒:台积电要合作?
- 本文转自:川越海峡即将于6月在成都举办的第31届世界大学生夏季运动会除了给大家带来精彩绝...|【爱成都·迎大运】“蓉宝机器人”科技赋能大运会
- “封校大学生又来整活了”系列视频登上抖音热搜|双一流大学生找对象,能有多“随意”?
- 本文转自:上游新闻第1眼-重庆广电消息|工厂每年最高节省近百万元电费 重庆首个兆瓦级“充电宝”投用
- 广东省科学技术奖揭晓,广州大学首获科技合作奖
- 中国地质大学|2.5亿年前的粗壮百色鱼龙 形似海豚且可能是高级掠食者
- 本文转自:上游新闻第1眼-重庆广电消息|重庆高速 “云”上见!
- 三星|她是芯片天才,13岁读大学19岁读博士,帮助我国打破国外芯片垄断
- 伊隆·马斯克|女大学生贷款创业失败,被黑心网贷平台逼做小姐,最后不能自拔!