基于结构活跃度的随机游走社区发现算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:woaizhmx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在目前信息化时代的今天,大量数据信息都存储在互联网中,针对问题进行复杂网络的建模,可以有效的解决各种节点分类、节点聚类、链接预测、影响力分析、可视化分析等问题。而针对复杂网络社区的发现可以有效的观察社区的整体结构,分析社区演化过程,找出中心性节点,针对真实网络问题的分析具有重要的意义。随着研究学者对社区发现算法研究的深入,基于图嵌入技术的社区发现算法、基于密度聚类的社区发现算法、基于标签传播的社区发现算法、基于随机游走的社区发现算法、基于统计推荐的社区发现算法、基于重叠社区的发现算法以及基于动态社区的发现算法等不断的涌现出来。在传统的社区发现算法中,谱平分算法每次只能将网络划分成两个社区,划分结果并不好。Girvan和Newman提出的GN算法没有确定终止条件,计算时间复杂度高。由于标签传播类算法的种子节点选择具有随机性,并且标签传播的方向随机,导致这类算法最终的社区划分结果不稳定。KL算法、ASOCCA算法等需要针对不同的数据集调整算法参数,而这些参数对划分结果影响很大,导致算法的可扩展性低。大部分传统的社区发现算法并不能找出重叠节点,解决重叠网络的社区划分问题。本文根据传统社区发现算法中的不足,提出了基于结构活跃度的随机游走社区发现算法(SARW)与基于游走与中心性节点选择的重叠社区发现算法(SARWCN)。主要在随机游走社区发现算随机法上提出了三点改进思想:首先,对于原有随机游走社区发现算法里,忽略社区整体结构特性的问题,通过添加社区活跃性因素,对随机游走的转移矩阵进行改写,提高了随机游走社区划分结果的模块度。其次,对于随机游走算法中的合并策略进行改进,在一些数据集的社区划分结果中合并小社区,能够提高社区发现结果的准确度。最后,针对重叠网络的社区划分问题,提出了基于随机游走与中心性节点选择的重叠社区划分算法,利用节点的特征向量找出社区中具有最大吸引概率的中心节点,从而发现处于两个社区之间的离心节点,根据离心节点与各社区中心节点的相似性,找出重叠节点及其所属社区,进而划分重叠社区。本文针对四个真实复杂网络以及用LFR网络模型构建的几个人工合成网络上进行社区发现算法实验。分别分析SARW算法与SARWCN算法与其他经典社区发现算法在非重叠网络和重叠网络上的模块度和标准互信息的比较结果。并且利用NetworkX库、iGraph库以及Matplotlib库画出社区划分结果,对复杂网络社区划分结果进行可视化展示。
其他文献
我国影子银行自2009年以来,规模经过十几年的快速膨胀已成为我国市场经济发展过程中不可忽视的重要因素。影子银行一方面能够借助信用创造功能将大量的流动性注入市场,使得货币总供给产生预期外的波动,货币当局的宏观调控更难把握;另一方面,影子银行缺乏监管导致其相关业务能对资金实现信用、期限与流动性错配,加高资金杠杠,滋生累积金融风险,威胁金融稳定。一行三会自2017年3月份开始,便紧锣密鼓地出台颁布各项针
本文旨在分析援助计划对老挝减贫的影响。老挝计划要在2020年脱贫,从而实现千年发展目标(MDG)引起各界关注。老挝目前已经获得了相当数量的外部援助以填补其发展差距,基于以上事实,本文在储蓄-投资缺口模型理论框架的指引下,选取1990年-2016年数据,应用ARDL模型分析援助计划对减贫的影响,如赠款援助,其他援助包括贷款援助、人道主义援助、外国直接投资、政府支出、国内投资和国际汇款等变量。本文实证
在我国经济结构转型期,企业资产有形性逐渐降低,此时通过区域金融发展缓解企业融资约束是加快新兴产业发展的重要前提。本文基于沪深两市上市公司样本数据,首先对上市公司资产有形性与现金持有量的关系进行研究。然后,对区域金融发展因素进行主成分分析,拓展研究区域金融发展对现金持有量与资产有形性的关系的调节作用。最后,通过稳健性检验和异质性分析探究本文研究结论的可靠性和差异性。研究发现,我国上市公司资产有形性有
实体链接(Entity Linking)是知识图谱领域一项关键的基础技术,其任务是要将非结构化文本中提及的实体和知识库中存储的实体进行一一映射,以帮助计算机更精准地理解输入的自然语言。实体链接在知识库扩展、信息检索、智能问答、内容推荐等场景下有着广泛的应用,是知识图谱领域的热点研究问题之一。本文通过对国内外基于图结构和实体嵌入的实体链接相关研究进行调研,针对实体链接研究中生成的候选实体集噪声过大,
我们的工作使用涵盖19852017年期间的历史数据来测试科特迪瓦经济增长与减贫之间的关系。STATA 14用于Johansen协整和单位根检验,以确定平稳性和变量之间的长期关系。VAR研究了人均GDP,失业增长率和公共支出对贫困后果的影响。我们的研究结果表明,公共支出与人类发展指数之间存在正相关关系,这是贫困发生率的间接指标。人均国内生产总值的比率与先验的预期相对应,并描述了贫困发生率的负相关性,
复杂网络是对复杂系统的抽象表示。系统中的实体被抽象地表示为网络节点,实体之间的交互关系被抽象地表示为网络连接。普适性使得复杂网络被广泛应用于社会学、生物学以及计算机科学等多个学科,相关理论和方法的研究具有深远的科学意义。面向不具先验知识的真实网络,如何高效地探索其拓扑结构是复杂网络分析的一项重要任务。作为一种生成模型,以贝叶斯理论为基础的随机块模型能够很好的处理该问题。相较于单一结构发现,随机块模
针对传统网络异常检测算法中异常阈值需要通过人工定义的问题,以及单分类支持向量机(One-Class Support Vector Machine,OCSVM)异常检测算法无法在高维海量数据中扩展的缺陷,提出了一种结合变分自编码器(Variable Auto-Encoder,VAE)和OCSVM的深度学习异常检测算法(VAE-OCSVM),以实现工业控制网络中异常值的检测和识别任务。在异常检测过程中
随着科学技术的发展,在生物学、经济学、人口学、自动控制理论及计算机网络等领域提出了许多需要应用差分方程解决问题的具体数学模型,可以说差分方程是描述状态变量随离散时
P2P网络借贷,是由借款人在线申请贷款,贷款人经过类似拍卖的程序,经过投标对借款人提供资助的民间金融形式。这一服务缓解了信贷市场的供需失衡,也因其便捷性、高收益性而迅速发展。目前,我国P2P发展猛烈并伴随有诸多问题。行业运行已经引发了一系列法律问题、增加了风险隐患,已与信息中介的最初形态背道而驰,不仅仅体现了行业违规操作、法律制度供给很不充足、法律监管缺失等风险。需要采取积极有效有针对性的措施,对
压电材料可实现机械能和电能之间的相互转换,在传感器、致动器、超声换能器等领域有着广泛应用。随着科技的发展,对压电材料的性能要求越来越高,因此亟需具有强压电性的材料