【摘 要】
:
在基于图计算的数据分析应用中,如何衡量图中顶点之间的相似度是一个非常重要的课题,在很多领域有广泛的应用。SimRank是近年来比较流行的相似性度量,相比于其它相似度指标,
论文部分内容阅读
在基于图计算的数据分析应用中,如何衡量图中顶点之间的相似度是一个非常重要的课题,在很多领域有广泛的应用。SimRank是近年来比较流行的相似性度量,相比于其它相似度指标,它能更好地反映图的拓扑结构信息。然而它的计算代价较高,传统计算方法已经不适用于规模越来越大的图数据。另一方面,Spark作为一种分布式计算平台能够简化用户编写分布式应用的逻辑,自问世以来迅速在学术界和产业界得到广泛的使用。因此,基于Spark或类似平台设计高效的大规模图数据中点对SimRank相似度的分布式计算方法,有着重要的现实意义。本文针对上述问题展开了深入的研究,取得的主要成果有:1.针对单源点SimRank相似度计算问题,提出并实现了一种基于随机游走模型的分布式算法。算法通过减少随机游走的数量以及紧凑的中间数据表示来降低计算的时间和空间复杂度,通过将游走的匹配计算过程分发至整个集群达到高并行度,同时设计了动态规划技巧加速匹配过程。实验结果表明,算法将随机游走的数量降低了数百倍以上,同时表现出近乎线性的可扩展性。2.提出并实现了一种基于模块度优化的多层次分布式图划分方法,算法在划分过程中较好地保留了图中的稠密子结构,在考虑划分约束条件的情况下保证了顶点的均衡划分,并力求最小化各个分块之间的边割大小。实验结果表明,算法的划分质量可以媲美经典算法METIS,同时有较好的可扩展性。3.针对图中全点对相似度计算问题,提出并实现了一种基于分治思路的计算方法。该算法通过分别计算分块内点对的相似度以及分块本身的相似度,来计算所有点对的全局相似度。实验结果表明,本文的方法在有效性上完全可以媲美SimRank,但计算效率得到了数倍至数十倍(3-16倍)的提高。
其他文献
《一叶山水》通过艺术的想象以跨时空的艺术思维方式,使山水世界置于一片叶子之上,展现在一片叶子中存在一方山水世界的意境,在画面中尽精微处致以广大,表现言有止而意无尽的
我国正处于社会转型期,社会矛盾多发,冲突加剧。社区作为社会生活的基本单元,成为透析社会矛盾的基本窗口。本文以社区冲突为主要研究对象,以西安市为研究范围,以《华商报》关于社区冲突的报道为研究样本,对城市社区冲突事件的传播与应对进行了探析。本文从社区冲突的总体发展趋势、社区冲突的问题类型、社区冲突发生的范围以及卷入社区冲突的主体等角度分析了2016年——2018年三年间西安市内社区冲突的呈现特点。研究
渔业作为农业当中一个重要的组成部分,是其中危险性最高的一个行业,也是被我国列为五大高危行业之一。渔业保险作为渔业风险保障体系的一个重要的组成部分,承担着风险转移、
党史如明灯,照亮前行之路;党史如清泉,洗涤心灵之尘;党史如号角,激发奋进之力.自党史学习教育开展以来,郑州市人大常委会机关自觉强化政治担当,扛起政治责任,对标对表中央、
组网雷达是由多个雷达站点所构成的系统,各个站点协同工作,可以根据实际任务需求同时对一个或多个目标区域进行监视,在现代战争中起着关键的作用。其优势为自由度高,可以根据战场环境和约束条件对其进行灵活配置,从而满足作战任务的需要。在现代作战场景中,环境千变万化,由于组网雷达的配置方式直接影响系统的性能。如果要提升组网雷达监视能力,就要根据变化的环境,实时地对组网雷达系统中的雷达站点进行合理配置。因此,如
图像语义分割是指:输入一张图像,输出该图像中每个像素点对应的语义类别。该任务是计算机视觉中最基础的任务之一,在现实生活中有着广泛的应用,如自动驾驶中的车道线检测,医
两岸民航运输的快速发展,给两岸人民的交流与两岸经济的发展起到了重要的推进作用,同时也势必会带来当事人之间的民商事法律纠纷。虽然两岸同属一个中国,但内地与台湾地区的
本文以笔者翻译的《英国社会史:1200~1500年》(节选)的原文和译文为研究对象,以奈达的逆转换理论为指导,旨在讨论译文中长难句的翻译技巧。英语长难句是指结构比较复杂的长句
本文选取Slippery Slope:Europe’s Troubled Future(《滑坡:欧洲的未来问题重重》)一书中第一章和第六章的部分内容作为翻译材料,探讨其中语篇衔接手段的处理。《滑坡:欧洲
软件定义网络(Software Defined Network,SDN)架构将传统网络的数据转发平面与控制平面分离,使其不再集成于同一网络设备中,从而简化了网络的设计管理。SDN架构中的控制层面由控制器组成,主要负责处理来自交换机的请求。已有研究表明,虽然单个控制器能够满足小型网络的需求,但考虑到可扩展性、可靠性等需求,单个控制器不足以满足大型网络的需求。所以现在多采用逻辑集中式、多个控制器物理分