复杂网络中的链路预测理论研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:caiql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络作为复杂系统的典型体现,经历了从欧拉开创的传统图论时代,到Erd?s和Rényi开创的随机图论时代,一直到Newman和Barabási等人开创了依托于真实数据的网络科学时代。在这一历程中,复杂网络的以中心性测度为代表的结构性研究和以链路预测、网络动力学为代表的功能性研究不断在诸多优秀的科学家手中发展壮大。链路预测是其中最年轻且活跃的一员。尽管在上世纪六七十年代链路预测已经萌芽,然而“链路预测”这一概念的第一次提出是在Liben-Nowell和Kleinberg在2007年对社交网络上链路的时序演化规律的相关研究。紧接着,Newman等人在2008年关于层次网络模型下预测缺失链路的研究使得这一概念被广为人知。自此以后,作为网络演化机制在链路层面的延伸和推广,链路预测在实证领域蓬勃发展—网络科学的学者们开发出了数以百计的基于节点重要性测度、网络生成模型和机器学习的链路预测算法,并将他们应用在推荐系统、生物信息等诸多应用领域。基于前人在链路预测领域的诸多贡献,我们将静态网络数据上的链路预测系统LP总结为3个步骤。第一步是打分,即将网络拓扑划分为训练集和测试集;第二步是使用算法对训练集上对所有节点对计算得分;第三步是结合已知的测试集信息对算法性能进行评价。在这其中,网络数据G和算法f是系统输入量,划分策略D和评价指标M是系统参量,具体的性能评测指标m是系统最后输出,即m=LP(G,f;M,D)为f在G上的表现。在链路预测系统LP(AUC,RDp)中,我们得到了更具体的AUC的解析表达,并适用于所有的链路预测算法。而针对更具体的基于局部拓扑的PA和Salton等算法,我们将得分分布转化为局部拓扑的分布,再借助随机图论和生成函数的数学工具,实现了从原始网络的拓扑分布到训练集中期望拓扑分布的转化,进而得到了从原始网络的拓扑性质到链路预测系统输出量的数学表达。相应的实证分析不仅证实了解析框架的有效性和鲁棒性,并且结合解析结果得到了基于原网络的全局拓扑指标和链路预测系统输出量的相关性,例如CN的AUC和聚类系数CC呈正相关关系。在对网络的可预测性进行讨论时,我们发现,对单一网络而言,算法泛化性能与准确性能存在矛盾;对多个网络而言,网络拓扑的共性往往决定着算法预测性能的上界,例如ER随机图模型生成的多个网络的可预测性仅为0.5。在链路预测系统LP(AUC,LOOT)中,AUC的数学表达则更为简单,仅依赖于算法在原网络中的打分排序就可以大致得到留一划分之后的AUC,这使得网络核心区域的链路自然拥有较大的可预测性。与此同时,针对网络结构可控性的鲁棒性分析显示,影响网络最小驱动节点数目的临界链路往往位于网络边缘区域。将上述二者结合我们自然得到了结论:临界链路的可预测较低,并称之为结构协调性现象。这一现象在基于真实网络和人工网络数据集上得到了印证。更进一步的结构协调性分析告诉我们,不仅链路属性与临界链路的比重均对于结构协调性有着重大影响;而且网络的核心-边缘结构是导致结构协调性的根本原因。
其他文献
中国正按照“规范、透明、开放、有活力、有韧性”的总目标深化资本市场改革,其中健全信息披露机制与完善投资者保护是重要的推进方向。在新发展阶段,资本市场有效发挥市场化资源配置功能和健全完善激励约束机制的使命与职责,离不开完善的信息机制和畅通的信息渠道。长期以来,我国资本市场参与者之间存在较为严重的信息不对称,导致一系列资源错配问题。管理层、大股东等内部人借助信息优势侵占公司利益的事件频频发生,进一步扭
学位
本文主要研究图的点染色和全染色问题,确切地说,是探究平面图的可松弛性和不含K5子式图的全染色。图G的k-全染色是指用k种颜色对V(G)∪E(G)中的每个元素染色使得任意两个有邻接或关联关系的元素染不同的颜色。而G的全色数χ"(G)则被定义为最小的正整数k使得G有一个k-全染色。Behzad和Vizing独立地提出了著名的全染色猜想:对任意最大度为Δ的图G,都有Δ+1≤χ"(G)≤ Δ+2。下界显然
学位
2007年至2009年的全球金融危机体现了世界金融体系的错综复杂性和巨大的系统性风险,也使得奈特不确定性再度引起了学者的关注。彭实戈院士于2006年所创立的非线性期望理论是处理金融中带有奈特不确定性问题的一个强有力的工具。与Kolmogorov所建立的以线性概率测度为基础的现代概率论公理体系不同,该理论是以非线性期望为出发点,系统建立起的一套全新理论体系,并且该新理论处处都直接对应着概率模型本身的
学位
宽带隙材料具有独特的物理化学性质,在功率电子器件、光学透镜、微波功率器件、机电耦合系统等领域具有广泛应用前景,是开发新一代国防军事、电子通讯、量子技术、医疗健康技术不可或缺的重要材料。宽禁带材料与传统的金属和窄带隙半导体材料(如:硅材料及大部分二维半导体材料)比较,其表面也往往缺乏足够的自由载流子,表现出很大程度的化学惰性,这给利用传统技术手段进行材料表面的加工、改性及结构制作带来了一定的困难,严
学位
MXene是一类性能优异,家族庞大的新型二维晶体材料,因其独特的二维层状结构,以及不同终端官能团展现出的可调谐的性质,引起研究者的广泛关注,在储能、传感、催化等领域具有良好的应用前景。随着研究的深入,MXene面临的问题便凸显出来。目前,MXene的主要合成方法为酸性含氟试剂刻蚀法,导致MXene表面含有大量的F终端基团,终端官能团比较单一,限制了性能的多样性;F终端MXene的稳定性差,极易被氧
学位
聚合算子(也称聚合函数)是用来模拟信息融合的数学模型.近几十年来,随着计算机科学的发展,信息聚合的研究已成为热门研究领域,也是人工智能领域的关键问题之一.目前,聚合算子理论已经广泛应用于模糊逻辑、近似推理、决策、模式识别、图像处理等领域.为了满足不同领域的应用需求,研究学者构造了许多种类型的聚合算子.按其行为、功能的不同,将聚合算子分为四类:合取型聚合算子(以三角模为代表)、析取型聚合算子(以三角
学位
本篇论文主要研究了带延迟的随机最优控制问题和随机斯塔克尔伯格微分博弈问题。我们建立了一般最大值原理、最大值原理与动态规划原理之间的关系、验证定理,得到了反馈控制、开环策略,讨论了闭环可解性。我们还将这些理论结果应用于实际问题,如最优投资问题、生产消费问题、资源分配问题等。经济金融、航空航天、网络通信等领域的许多问题都可以转化为最优控制问题,然而,现实世界中某些现象的发展不仅仅依赖于当前时刻的状态,
学位
图的点划分问题是图论研究中非常重要的研究课题。图的点划分问题是指把图的顶点集划分成一些互不相交的点子集的并,使得划分之后的子集或者子集之间满足某些条件。图的点染色问题可以看成是把图的顶点集划分成一定数目的独立集的不交并。Erd?s-Lovász Tihany猜想研究的是对于满足一定条件的图,可以把它的顶点集划分成两个不交的子集,使得这两个子集的导出子图的点色数足够大。本论文首先对图的列表分离染色进
学位
对称性是构成现代物理的核心概念,晶体材料反演中心破缺往往使材料具有极性。铁电晶体材料不具有中心对称性,材料表现为自发极化,表现出铁电、压电、热释电、电光等一系列重要的物理效应,在国民经济、国防军事、信息通讯、医疗健康等领域具有重大应用。铁电材料极性的存在使得其往往对外场(如:电,光、热,力,声等)和表界面结构特征十分敏感,可通过应力场结合材料微结构缺陷调控的方法实现材料极性的调控,如:外延应变调控
学位
随着量子计算理论及实际实现研究的快速推进,基于离散对数、大整数分解等经典数论难题的公钥密码体制受到严重威胁,抗量子密码体制的研究成为广泛关注的问题。为应对量子计算机的威胁,2016年12月,美国国家标准技术研究院(Na-tional Institute of Standards and Technology,NIST)向全球范围 内征集抗量子密码算法标准,该行为引起世界各国各密码组织的高度关注。经
学位