框架|上海交通大学过敏意:面向城市治理的图智能分析框架( 四 )


并发图计算主要面临的瓶颈主要有以下三个。
(1)用户图计算请求主要有图管理、图分析。在图管理方面,已有较多并发性优化工作,比如说数据仓库、图查询等。但对图分析方面,比如管理查询不到结果以后怎么样能够对放到基层单元弄出决策来,这方面还缺乏研究,易成为性能瓶颈,所以说我们要做这方面的事情。
(2)并发图分析任务之间的不规则干扰,多个图算法并发执行时,会在时间与空间两个维度对处理器和内存等资源进行抢占,且干扰方式不规则,优化空间很大。
框架|上海交通大学过敏意:面向城市治理的图智能分析框架
文章插图

比如用户的要求各不相同,用户提出的请求也各不相同。这些图请求比如Pagerank、Kmeans等这些都是不一样的,那么具体到图的分割查询和内存的放置都可以以不同方式来进行模块放置,调度也不一样。所以这里的优化空间非常大,一个是复杂,一个是不规则的干扰。
(3)并发图分析与图查询任务间的协同。
框架|上海交通大学过敏意:面向城市治理的图智能分析框架
文章插图

请求还存在对同一块图数据的访问依赖问题,进一步提升并发图查询的效率对于释放并发图分析性能也至关重要。比如说有的要查询边,有的查询点,有的要查询整张图。对这些分割的任务,也就是并发来的任务,对一些子图的分割和综合又是一个非常复杂的问题。

4

对并发图分析的初期探索
(一)工业界项目概述
现在工业界对于图的分析、图的并发、图的查询非常重视,但是图拓扑属性分析现在还不多。Apache 上目前的开源图计算系统主要以图数据库管理为主,面向图拓扑属性分析的并发图管理系统还处于萌芽阶段。这是我们调查下来整个Apache Graph Systems的列表,大概就是这几十个:
框架|上海交通大学过敏意:面向城市治理的图智能分析框架
文章插图

相关链接:http://tinkerpop.apache.org/
(二)学术界研究总览
框架|上海交通大学过敏意:面向城市治理的图智能分析框架
文章插图

早期基本上关注的是图的请求,焦点主要是图查询。到2014年开始有并发图分析,然后多用户并发图比如图数据共享已经开始关注了;2017年提出多图多用户场景,但对图请求内部缺乏分析;到2018年对请求内部特征优化以及图并发的计算进行考虑。国内主要在做的高校是上海交通大学、华中科技大学、北京大学。
(三)上海交通大学做的一些工作
(1)图化治理任务的并发计算框架
框架|上海交通大学过敏意:面向城市治理的图智能分析框架
文章插图
文章先后发表在IEEE ICCD和IEEE TPDS上
我们做的工作就是对图化治理任务的并发计算做了一个框架,也就是对线下进行绘像线上调度相结合,将访存特性传递给调度器,这样并发的会比较快,消息传递就会比较快。然后提出架构感知的负载均衡和线程调度、优化多图的并发运行的效果请求性能可以提升5.4倍了。实现了一套面向图化治理任务的冗余操作削除机制,对整个图存在的幂律分布、缩减操作等都做了分析,然后改进了图化治理任务流程,使分析提升了很多倍。
框架|上海交通大学过敏意:面向城市治理的图智能分析框架
文章插图

(2)图化治理任务的高效编程框架
框架|上海交通大学过敏意:面向城市治理的图智能分析框架
文章插图
文章先后发表在IPDPS和ACM TACO上