中科大王杰教授:基于表示学习的知识图谱推理技术( 二 )


另一方面 , 知识图谱中的技术和任务都包含深度语义理解 。 例如融合技术中 , 需要利用推理技术对齐不同知识图谱的实体;问答技术中需要推理技术拓展问句的语义;分析技术中需要推理技术帮助进一步挖掘图数据中的信息 。
因此 , 凡包含深度语义理解的任务都涉及推理的过程 。 而知识图谱的推理目标是利用知识图谱中已经存在的关系或事实推断未知的关系和事实 。 换句话说 , 就是由已知的一个或者几个判断 , 推断另一个未知的判断 。
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
知识图谱的推理有两种形式:基于规则的推理、基于表示学习的推理 。 基于规则的推理是指基于本体逻辑的演绎推理 , 例如若A属于B , B属于C , 则A属于C 。 这种推理虽然可解释性强 , 精度高 , 但需要事先写清楚规则 , 所以在实际应用中不够灵活 。 当涉及大规模数据时 , 可以使用统计方法总结归纳出规则 , 这也称为归纳式的推理 。
基于表示学习的推理需要将实体以及实体之间的关系映射到向量空间 , 然后通过向量空间的操作进行建模逻辑关系 。 这种方式易于捕获隐含的信息 , 但却丢失了可解释性 。
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
列举一个基于表示学习的推理的工作原理 。 上图中存在两个三元组:; 。 将其映射到向量空间之后会发现 , 中国与北京这两个向量之间的差值 , 接近美国与华盛顿之间的差值 。
然后定义一个函数 , 希望三元组映射到向量空间之后 , 头实体+关系的向量表示尽可能接近尾实体的向量表示 。 如上图中的f(h,r,t)函数 , 既可以是Loss函数也可以是打分函数 。
中科大王杰教授:基于表示学习的知识图谱推理技术】打分函数某种程度上是三元组为真的置信度 , 如上图右下角的例子所示 , 根据打分值(置信度)确定“英国的首都是伦敦” 。
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
进一步 , 根据输入 , 基于表示学习的知识图谱推理分为简单推理和复杂推理两类 。 简单推理类似链接预测 , 根据知识图谱中已有实体和关系推理两个给定实体的关系 , 其难点在于理解已有实体和关系的语义 。
复杂推理相对于简单推理 , 其输入更加复杂 。 根据输入的不同 , 难点分别在于:
建模关系间的语义结构 , 给定实体关系未在训练模型中出现过 。
建模复杂的结构化问题 , 包含若干个一阶逻辑 。
建模非结构化问题 , 输入数据包含人类口头语等 。
1
简单推理最新进展
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
直观理解简单推理 , 例如有一个头实体和一个尾实体 , 然后希望补齐与之对应关系 , 从而最大可能让三元组成立 。
还是以人物知识图谱为例 , 已知(训练数据)“蒋英的丈夫是钱学森 , 蒋英的父亲是蒋百里” , 请问钱学森和蒋百里之间是什么关系?为了较好解决这一链接预测问题 , 需要对知识图谱中实体之间的关键性质进行建模 。
方式有三:语义近似、语义分层、语义融合 。 例如老虎是哺乳动物 , 老虎和狮子语义相近 , 就可以推理出狮子是哺乳动物;狮子属于猫科动物 , 猫科动物属于哺乳动物 , 根据语义分层现象可以推理出狮子是哺乳动物;语义融合是指结合知识图谱以及非知识图谱的非结构化文本描述 , 从而捕捉实体的潜在语义 。