中科大王杰教授:基于表示学习的知识图谱推理技术( 三 )


语义近似
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
对于语义近似 , 目前的经典方法是“基于张量分解的知识图谱嵌入模型” , 例如CP、RESCAL、ComplEx等等 , 此类方法的共同点是三元组为真的概率由内积定义 。 其存在的问题由上(右)图所示 , 在向量空间中相近语义的实体具有不相近的表示 。
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
基于上述缺点 , 我们提出“面向张量分解的知识图谱嵌入模型的正则项” , 其思想在于让语义相近的实体表示内积尽可能的大 , 距离尽可能的小 。 如上(左)图所示 , 除了希望尾实体的向量尽可能落在黄色的虚线上 , 也希望尾实体的向量表示尽可能地落在椭圆(红色区域)里 。
如何做到?添加基于对偶距离模型的正则项 , 用向量差的2范数表示原始内积 。 将“2范数”展开之后 , 会发现这一表达式也包含了原始内积 , 以及后面两项2范数的平方 。 最后会得到对偶诱导正则项:由原来的内积+头实体2范数+尾实体2范数 。
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片