知识|产品视角下的知识图谱构建流程与技术理解( 九 )

下一步就是使用知识图谱，通过各种计算与分析从大数据中获取价值，进而进一步支持语义搜索，智能问答，辅助分析等应用场景。
从知识图谱构建到应用的中间一步，就是知识图谱推理、知识统计与图挖掘。
先说知识统计与图挖掘，其实就是传统意义上的数据统计与挖掘，只不过数据是知识图谱，而图相对树、链表等又是比较复杂的，尤其是知识图谱规模较大，有时寻找特定数据或关联数据要耗费大量的时间和算力。
查询又是知识图谱中最常见的计算，比如要查询某一个实例及其关联信息，RDF三元组中可以将其转变为对于关系型数据库的查询。
而对RDF图模型或者图数据库如Neo4J来说，这就是查询符合条件的一部分节点和关系，即子图查询，比如搜索“水泥是由什么组成的”，就是搜索“水泥”以及所有与其存在“组成”关系（或者与其他组成同义词，如“原材料”，“用于建造”等）的节点所构成的图，使用的算法如深度优先搜索或广度优先搜索等图算法。
同时还可以对图的特征进行统计，比如有向图中指向某个节点的边有多少（入度），该节点指向其他节点的边有多少（出度），节点在图中重要地位的中心度等等。
比如统计图谱中某一家公司与其他公司的到期未偿还债务关系多少（属于“到期未偿还”关系的边和节点的多少），按此来选择一批信用不良的公司，或者某些出入度离群的点，是否存在刷单情况等等，将图谱用于异常检测。
还有一种很常见的情况，就是对图谱中多个节点关系进行关联分析，比如侦破金融里的团队诈骗，往往一个诈骗团队有非常复杂的关系网，可以通过图谱查找多个账户之间的转账关系，或者与可以账户关系密切的账户。
其中常用的方法有路径查询、距离计算，输出结果为节点及节点间边的距离和边的集合(路径)。
或者对某一个节点或事件做时序分析，观察事件发展中都涉及那些团体和事件，常见的方法如时序分析。
知识统计与图挖掘是对图谱中已有知识的查询、统计和展示，通过明细数据的展示，或者聚合成更高维度的数据来发掘价值，通常是得到新的结论，但不会拓展知识图谱中已有的数据，从知识图谱的角度来说是没有产生新的知识。
而知识推理则是根据已有的知识，按照某种规则或者策略，产生新的知识（新的三元组）。
举个前面提到的例子，知识图谱中存在<砂石，组成，水泥>和<水泥，组成，混凝土>两个三元组，通过知识推理，可以得到<砂石，组成，混凝土>，即通过一定的知识推理得到未知的事实与关系。
知识推理有很多应用，如知识问答就可以通过知识推理来实现，或者可以补全一部分知识图谱，检测与推理内容不一致的节点。这些一方面可以改正知识图谱的质量，修复一些明显的错误，另一方面在知识问答中可以推出一些新的结论和回答。
面向知识图谱的推理主要围绕关系的推理展开，即基于图谱中已有的事实或关系推断出未知的事实或关系，一般着重考察实体、关系和图谱结构三个方面的特征信息。
知识图谱的推理的主要技术手段主要可以分为两大类：
基于演绎的知识图谱推理和基于归纳的知识图谱推理。
演绎推理是一种自上而下的推理，在指在给定的一个或多个前提的情况下，推断出一个必然成立的结论的过程，我们熟悉的三段论就是典型的演绎推理。
演绎推理的过程需要明确定义的先验信息，比如在某某前提下，所以基于演绎的知识图谱推理大多围绕本体展开，比如某事物具备某一属性，则必然不存在于与该属性互斥的事物范围内。