中科大王杰教授:基于表示学习的知识图谱推理技术

中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
作者|维克多
编辑|青暮
知识图谱蕴含丰富的人类先验知识 , 具有重要的学术价值和广泛的应用前景 。 知识图谱推理作为知识图谱领域的核心技术 , 能够极大地扩展现有知识的边界 , 有力地辅助人类进行智能决策 。
2021年12月17日 , 中国科学技术大学教授 , 博士生导师 , 国家优青王杰在CNCC2021“知识为意 , 图谱为形--基于图机器学习的知识推理”专题论坛上做了《基于表示学习的知识图谱推理技术——从简单推理到复杂推理》的报告 。
在报告中 , 王杰结合知识图谱近年来的研究趋势与应用场景 , 聚焦从单一图谱推理到联合外部信息推理、从结构化输入到自然语言输入的层次递进的推理场景 , 介绍基于表示学习的知识图谱推理方向取得的进展 。 最后 , 王杰展望了知识图谱推理技术未来发展所面临的若干挑战和机遇 。
例如 , 他提到:“当前广泛使用的数据集无法准确地反映真实场景模型 , 现在的模型测试时基本采用封闭世界假设 , 不符合真实应用场景 , 会导致本该正确的结果被判断为错误……现有知识图谱只涉及文本信息 , 未来的发展趋势是扩展到多模态信息 。 多模态知识图谱依赖于多种模态数据的收集 , 其中关键问题是……”
以下是演讲全文 , AI科技评论做了有删改的整理:
今天的演讲题目是《基于表示学习的知识图谱推理技术——从简单推理到复杂推理》 , 分为背景介绍、简单推理、复杂推理、未来展望等四个部分 。
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
知识图谱的本质是大规模的语义网络知识库 , 表示对客观世界实体的描述 。 如上图左下角人物知识图所示 , 每一个节点代表一个人物 , 边代表人物之间的关系 。 而在计算机中 , 知识图谱以三元组的形式存储 , 包含头实体、关系、尾实体 。
我们总希望得到大型的知识图谱 , 因为在规模效应的作用下 , 会给应用效果带来质变 。 知识图谱可以分为两类 , 一类是通用知识图谱 , 面向通用领域的百科知识库 , 另一类是领域知识图谱 , 面向特定领域的行业知识库 。
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
通用知识图谱覆盖面较广 , 但所包含的知识层级体系较浅、粒度较粗、精度不高 , 领域知识图谱则相反 , 其覆盖面较窄 , 只面向某个特定领域 , 包含的知识深度和精度往往有更高的标准和质量 。
知识图谱最早可以追溯到60年代的专家系统 , 当时主要是依靠专家知识 , 通过人工进行构建 , 所以成本较高 。 经过多年发展 , 知识图谱逐渐转向自动化构建 , 1998年提出的语义网络和2006年提出的链接数据是“自动化”发展的关键节点 。
2012年 , 谷歌发布知识图谱 , 并将其应用到搜索引擎当中 。 这时knowledgegraph词汇第一次被明确提出 。 目前 , 谷歌、百度等构建的知识图谱已经包含超千亿级别的三元组 , 其背后所依赖的是大数据驱动下的自动知识获取技术 。
中科大王杰教授:基于表示学习的知识图谱推理技术
文章图片
知识图谱属于典型的交叉技术领域 , 包含众多的技术要素:存储、查询、构建、获取、推理、融合、问答、分析等等几个方面 。 在众多要素中 , 推理是核心的技术和任务 。
一方面 , 知识图谱的存储、查询、构建与获取 , 不仅仅是为了能够描述客观世界、总结人类先验知识 , 更重要是为知识图谱推理服务 。