论文部分内容阅读
最近四五十年间,研究复杂网络的学者就开始从微观的角度钻研网络中的节点和连边。关于边的研究大致分为三个方面:边的强弱,链路预测以及边的重要性。边的重要性研究与边强弱的度量和链路预测都是不同的概念。有时,连接强度大的边在网络中并非是很重要的,而连接强度小的边的重要程度未必就差;链路预测的研究对象是网络中未知的边,而边的重要性则是对网络中存在的边进行研究。详细地来说,边的重要性研究是对网络中单边的影响力进行评估。针对的网络类型不同,边的重要性的意义也不同。例如,在信息的扩散过程中,往往阻断一个节点的所有通信是不切实际的,此时截断一些重要的通信链路来阻止传播更加切实可行;再如为了减少电网中的级联故障,可以通过识别重要的传输线来防止对电网的可能攻击。因此,可以得出这样的结论,即复杂网络中重要边的识别与量化具有重要的研究意义。近年来,众多学者在研究并发现网络中较为重要的边方面做出了很大的努力。但这些研究方法存在着一定的问题,如未能考虑到信息传播因素的影响,而且大部分方法都是基于全局的,从而导致其时间复杂度较高等。因此本文从三个方面分析并探讨了网络中边的重要性的研究现状,根据其存在的问题进行深入的研究,取得的创新性成果主要分为两个方面:(1)维持网络的全局连通性是边的基本功能与作用。本文从图的组合结构出发,利用反向贪婪的思想来量化网络中连边的重要程度,这些网络中的重要连边对增强网络的鲁棒性有很大作用。因而,为了在合理的时间得到一个较优的关键边的集合,提出了一种反向启发式算法(Reverse Greedy Algorithm of Edge,ERG):首先,根据边的中心性反向选择使代价函数最小的连边,并将其逐个添加到初始的空网络中,直到得到一个与重要程度相反的边排序结果。在9个真实网络数据集上的实证分析表明,这种连边反向贪婪算法较其他边重要性度量方法更能准确地度量边的重要程度。(2)边除了维持网络的连通性外,同时还承载着信息的传播。考虑到信息的传播易受连接强度、传播者和受传者的作用以及传播途径等因素的影响,同时结合网络的拓扑性质,本文提出了一种基于信息传播影响因素的边重要性度量方法(Information Spreading Model,ISM)。通过综合考虑影响信息传播的几方面因素与网络拓扑特性来刻画边的重要程度,旨在充分利用信息传播与网络连通性两方面信息以更加客观得分析其重要程度。然后在9个真实网络数据集上对本文提出的ISM算法的性能进行评估。通过与经典的边重要性方法Jaccard系数、桥边、介数中心性以及可达性指数进行对比表明,该方法在网络连通性和扩散动态过程中,对于识别重要边均优于其他方法。总之,本文针对边重要性研究的不足之处,提出了两种评估边的重要性的方法。并在真实网络数据集上对所提方法进行了性能评估。本文的工作为边的重要性识别提供了新的研究思路与启发,对维持网络鲁棒性与快速瓦解网络等有着重要的意义。