复杂网络软件模型与社区发现方法研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:liyizhong1235
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,复杂网络作为交叉学科在很多领域得到了快速的发展,特别是在计算机领域得到了学者们的重视和研究。现实世界中的Internet、神经网络、蛋白网络、社交网络等可看作组成单元抽象为节点,组成单元之间的关系抽象为边的复杂网络。复杂网络的“小世界效应”,“无标度特性”和“社区结构”成为复杂网络的研究热点。随着复杂网络研究的不断深入,应用领域的不断拓展,如新陈代谢途径预测、Web社区挖掘、搜索引擎、开源软件等,新兴的领域的网络问题成为新的研究方向,主要包括:1)软件领域的网络特性;2)软件领域的网络模型演化;3)大规模复杂网络需要高社区发现精度和低复杂度问题;4)重叠社区结构的重叠程度和结果的质量问题等。本文围绕开源软件领域的网络特性、网络模型的演化和复杂网络社区发现问题展开研究,解决了开源软件网络的特性分析和开源软件网络演化模型中的相关问题,并提出了新的复杂网络的社区发现算法。本文的主要研究成果包括:1)选取两款面向对象开源软件框架Web Work和Spring作为研究对象,无(有)向图节点代表类,边代表类间的依赖、关联等关系,将系统抽象为网络图,并对其拓扑结构进行分析。研究表明无(有)向网络具有较大的聚类系数和较小的平均路径长度,具有小世界特性。实验结果表明:度分布统计特性仍然具有无标度特性。2)提出了一种基于局域事件的软件网络演化模型。该模型以面向对象软件系统为研究对象,对BA无标度网络模型进行改进,增加了节点和边的变化等局域事件,并应用该模型模拟软件网络的演化过程。实验结果表明,该模型演化生成网络的度分布服从衰减幂律分布,与真实软件网络的度分布基本一致,能较好地描述真实软件的演化增长情况。因此,该模型可以用于对面向对象软件网络演化进行模拟和评价。3)提出了一种马尔科夫随机游走蚂蚁社区检测算法。该算法受马尔可夫随机游走模型理论的启发,蚂蚁位于群集内任何节点的概率将大于蚂蚁位于群集外的概率。通过随机游走,揭示了网络结构。该算法是一种随机方法,它使用了在网络中的蚂蚁遍历期间收集的信息。在不同的数据集上验证算法,包括计算机生成的网络和现实世界的网络。结果表明,算法运行速度适中,提供了可接受的时间复杂度,其结果在实践中表现良好。4)提出了一种基于k-clique(派系)和遗传算法的复杂网络社区。该算法基于k-clique对种群初始化,采用(μ+λ)选择策略和Q函数来选择下一代种群,然后,对所形成的社区进行聚类,实现了社区划分。在基准网络和真实网络上完成了算法有效性验证实验。该算法可以提高种群初始化的精度和效率,父代在进化过程中形成的优良性状不会被破坏,并可有效地遗传给子代个体。同时,该算法减少了社区划分的搜索空间,提高了搜索效率。5)提出了一种基于Page Rank和节点聚类系数的重叠社区发现算法。算法使用Page Rank算法对节点的影响力进行排序,可以稳定社区发现结果,节点的聚类系数是一个与节点相关的值,使用节点的聚类系数修改算法的参数并限制每个节点拥有最多标签的数量,可以提高社区挖掘的质量。在人工网络和真实世界的网络上测试,实验验证了该算法能够有效地检测出重叠社区,并具有可接受的时间效率和算法复杂度。6)提出了一种基于k-clique的局部优化重叠社区发现算法。该算法假设clique是社区核心,采用密度最大的单个节点作为初始社区,使用基于适应度函数的局部优化搜索策略,在自然社区扩展时都添加k-clique,从而实现重叠社区的发现。提高了算法的搜索效率。在人工网络和真实世界的网络上进行了实验,实验结果表明该算法得到了更好的重叠社区发现精度。
其他文献
随着计算机和互联网应用技术的快速发展,数字媒体在人们的日常生活中得到了日益广泛而深入的应用,这些通过公开网络传输的数字媒体信息极易遭到非法拦截、篡改和攻击,如何保
机动目标跟踪一直是目标跟踪领域中的难点问题,尤其是对多机动目标跟踪。由于目标数的变化,目标新生和消失,以及目标相互紧邻、交叉等复杂场景,使得跟踪变得更加困难。针对该
随着大数据时代的到来,林业相关部门在日常活动和信息化建设的过程中产生大量有价值的数据信息。但是,对于网络上分布的海量林业文本来说,主要存在以下两个特点:一是文本数量
全球化程度不断加深,生物安全形势已发生转变,加上在当前抗击新冠疫情的背景下,习近平总书记提出要将生物安全纳入国家安全体系,全面提高国家生物安全治理能力。虽然近年来我
卫星云图是由气象卫星自上而下观测到的地球上的云层覆盖和地表面特征的图像。利用卫星云图可以识别不同的天气系统,确定它们的位置,估计其强度和发展趋势,为天气分析提供依
我国《担保法》及其司法解释规定了保证人求偿权,以保障保证人的合法权益,而对于保证人代位权并未有该字样的出现,理论界对我国法律是否规定了这一权利存在不同的看法,各级人民法院在司法实践中关于此类案件的定性及处理方式存在多样性的特点。其分歧集中于以下问题:首先,保证人代位权是否是存在的,有无存在的必要性;其次,该权利与保证人求偿权之间是何种关系;最后,在司法实践中保证人应如何行使自己的权利。本文拟从立法
互联网信息技术蒸蒸日上,互联网上所存储的信息与日俱增。大数据来临的时代,科学、金融等各个领域如鱼得水飞速发展,人们需要处理过去计算机架构无能为力的数据。云计算作为
全球碳循环变化是全球气候变暖的重要影响因素,探究陆地生态系统与大气碳交换模型并分析碳通量与各生态因素的响应关系,具有重要研究价值。当前,基于生态机理建模和基于生态
有机薄膜晶体管由于其柔性可穿戴、成本低、可低温制备和大面积生产等特点,被应用于有源矩阵平板显示、电致发光二极管和“电子纸”显示等。然而,由于有机半导体无法实现稳定的重掺杂,导致其有机半导体与电极之间无法形成欧姆接触,存在较高的肖特基势垒,极大地影响了有机薄膜晶体管的性能,阻碍了低功耗和高增益有机薄膜晶体管的实现与发展。因此,我们需要深入研究有机薄膜晶体管的肖特基势垒,并做到其势垒高度可调控,实现欧
随着云计算(Cloud Computing,CC)的蓬勃发展,越来越多的关键业务应用迁移到云数据中心,并通过云数据中心向用户提供服务。云计算提供多种服务模式,其中基础设施即服务(Infras