异构信息网络链路分析与预测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xunitt1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中,存在很多复杂网络,如社会网络、信息网络和生物网络等。这些复杂网络中的节点或实体用于表示个人、计算机、生物元素等,节点之间的链接用于表示节点之间的某种关系或相互作用。分析网络中的个体的行为或者关系是复杂网络研究中的一个重要的研究内容。然而,由于观测者在时间、数据采集等方面的限制,对网络的观测通常是不完整的,观测得到的复杂网络存在链接丢失等情况。链路预测是通过网络的拓扑结构信息、节点的属性、观察到的链接等信息,寻找丢失的链接以及预测未来可能出现的链接。链路预测在许多不同领域都有广泛的应用。例如,在社交网站给用户推荐可能存在的朋友;在科学网络中帮助预测哪些研究人员在将来可能存在合作关系;寻找网络中被删除的数据或记录等等。因此,本文重点研究了链路预测技术,主要的研究内容如下:本文首先研究了针对同构拓扑复杂网络的链路预测技术。网络嵌入(NE)可以有效减少数据维度,提高复杂网络链路预测的运行效率。现有的网络嵌入研究主要利用网络的结构信息进行编码,嵌入特征比较单一;虽然,也有部分算法加入了文本内容,然而这些方法是基于文本内容的单个节点嵌入,没有考虑不同节点之间的连接关系,不能表述与不同邻居节点相连接时的不同语义关系。因此,本文提出了一个基于网络结构和文本信息的协同嵌入模型(NSTI),算法不仅学习基于网络结构信息的节点嵌入,而且同时学习节点与不同邻居节点之间的交互信息。算法不是对单个节点的词进行学习,而是将这对节点的词嵌入序列之间的交互信息进行计算,用于表述了节点与不同的邻居节点相连接时的不同语义关系。在真实的数据集上对链路预测的实验表明,提出的模型和算法在AUC值上比现有的算法Deep Walk,LINE,Node2vec,TADW和CENE均有2%-15%的改进,证明了该模型可以有效提高链路预测准确度。在现实世界中,大多数系统都是异质信息网络,往往存在着多种类型的节点以及节点间多种类型的关系。我们随之研究了异质信息网络上的链路预测技术。异质信息网络中节点间的关系比同构信息网络更为复杂,通常需要通过元路径来处理异质信息网络中的节点及节点间的复杂关系。但是,仅基于元路径学习的嵌入并不能够充分表示异质信息网络中节点间的相互信息。因此,我们计算网络中节点对之间的属性特征相似度,用以提高链路预测实验的精确度。同时,针对不同的语义信息,我们提出不同元路径的融合函数,提高节点的嵌入向量的精确度。基于以上研究,本文针对异质信息网络,提出了基于节点相似性和元路径的网络嵌入模型(NSMF)。通过在真实的两个异质信息网络数据集上的实验结果分析,本文提出的NSMF模型算法在AUC值上比针对同构信息网络的算法Deep Walk、Node2vec和LINE提高了约30%-40%;而对于异质信息网络的几个算法Hin2vec、Metapath2vec和PTE,NSMF模型算法的AUC值比它们提高了约2%-10%。实验结果证明了该模型在链路预测实验上的有效性。
其他文献
无约束优化问题广泛应用于工程生产等各个领域,用于求解这类问题的方法中,共轭梯度法是一种非常重要的选择,随着问题规模的越来越大,子空间技术成为求解大规模优化问题的一类非常有效的数值方法。最近,由于无约束优化问题复杂度不断的提升,有很多学者注意到将子空间技术和共轭梯度法相结合形成的子空间共轭梯度法,该方法主要是在一个子空间上对目标函数的近似模型进行极小化,其中,近似模型大部分选用的是目标函数的二次近似
学位
西方哲学从产生起就展现为一种形而上的追求,形而上学是西方传统哲学最典型的表现形态。无论是古代的本体论哲学还是近代的认识论哲学,其基本特征都表现为超越人的感性经验和现实生活去追寻宇宙万物的终极存在和原因,并运用形式逻辑的方法通过抽象概念表达最一般的原理。尽管西方传统哲学与西方科学的繁荣发展有密切的联系,但它所构建的“概念王国”又的确凌驾于现实世界之上,这种二元分立的思维模式把我与世界分割开,用普遍原
磁存储技术一直是信息存储领域中最为重要的技术手段之一。随着信息化时代的到来,人们对磁存储的速率和容量有着越来越高的要求。与外部写入磁场和激光热辅助这两种传统的实现磁化反转的方法相比,全光磁反转不仅不需要外部磁场的帮助,而且还可以极大地加快磁化反转的进程,从而提高存储速率。因此,全光磁反转技术具有重要的研究意义和实际应用价值。目前,全光磁反转大多采用传统的圆偏振光入射以及用低数值孔径透镜来进行聚焦,
学位
由于GDP指标无法反映整个国家的环境状况、社会分配以及社会福利等弊端,故在近年来提出的修改国内生产总值的新指标中,相继出现了绿色GDP、人类发展指数、真实储蓄以及包容性财富指数等,其中包容性财富指数较为被看好。《包容性财富报告》系列报告的发表使更多政策决策者以及其他群体更好理解国家的经济状况,从而为决策者进行决策提供了参考。但是由于该指标的测度范围不够全面,具体表现在:一方面该报告包括人力资本、生
研究目的:通过查阅文献,探讨古今医家从脾论治绝经过渡期崩漏病的特点,分析脾与绝经过渡期崩漏病的联系;通过跟随导师临床实践,总结导师从脾治疗绝经过渡期崩漏病的临床经验。研究方法:1.通过检索“知网”文献数据库,以“脾虚证”、“更年期崩漏病”为检索词,收集近十年中医治疗绝经过渡期崩漏病的文献5篇,分析古代与现代医家治疗该病的理论依据与临床研究,并分别阐述脾的生理功能与气血、生殖轴、肝肾等相关脏腑之间的
猪肉是全世界最受欢迎的肉类,脂肪含量是猪肉产量和瘦肉率的决定因素之一。在遗传育种角度,减少背膘厚度,提高瘦肉率,也已成为各大猪场遗传育种的关键目标,而背膘厚与瘦肉率的重要参数之一即是皮下脂肪含量。长链非编码RNA(long noncoding RNA,lncRNA)是一类广泛存在于生物体内的不编码任何蛋白质的RNA,其大多不保守,但其中有一类在各物种进化过程中序列保持完全相同,被称为超保守lncR
学位
翻译研究在经历了文化转向后,学者们将视角从翻译的语言功能转移到注重对其文化功能的研究上来。而当今的中国社会恰好处于一个更加重视建立文化自信的时期。建立文化自信既是内在活动,即使国人更深入地了解和理解祖国的文化内核,同时也是外在活动,即向外界展示和传播本国的历史文化内涵。而文化专有项作为文化的载体,在一定程度上承担了传播中国文化和建立文化自信的责任,因此对文化专有项的翻译研究具有急迫性和相当重要的意