【摘 要】
:
随着互联网的发展和便携式移动智能设备的普及,现代社会里每分每秒都在创造着浩如烟海的数据。网络是一种非常常见的用于表示实体之间关联的数据形式,且在现实生活中无处不在,其内容形式深入到了现代生活的各个领域。对网络进行研究首先需要获得一种良好的网络表示方法,使网络数据的分析和利用更加方便和高效。网络嵌入是一种构造出能良好表示网络潜在信息的技术,其目的是在保留原始网络潜在信息的前提下,将其转化为一个维度更
论文部分内容阅读
随着互联网的发展和便携式移动智能设备的普及,现代社会里每分每秒都在创造着浩如烟海的数据。网络是一种非常常见的用于表示实体之间关联的数据形式,且在现实生活中无处不在,其内容形式深入到了现代生活的各个领域。对网络进行研究首先需要获得一种良好的网络表示方法,使网络数据的分析和利用更加方便和高效。网络嵌入是一种构造出能良好表示网络潜在信息的技术,其目的是在保留原始网络潜在信息的前提下,将其转化为一个维度更低的向量表示,因而可以很好解决用图表示的网络数据难于应用到机器学习及计算复杂度高等问题。Deep Walk是一种网络嵌入方法,它利用随机游走的方法得到节点序列,再将这些节点序列作为输入,应用于词嵌入方法中,得到网络的低维向量表示。然而由于现实中的网络大多是不均衡的,即存在簇,且簇与簇之间可能只靠极少数节点相连接,而通过随机游走获取节点序列的方法在这样的网络中,初始点的选择对随机游走产生的节点序列有一定影响,很有可能出现只在某个簇内游走,导致该簇外节点不易被访问到的问题,从而使许多节点信息丢失,影响最终嵌入的结果。本文为了改善基于随机游走的网络嵌入在含有簇的网络中的上述局限性,通过对大量文献的阅读,利用多跳随机游走提出了一种网络嵌入的方法NEMRW(Network Embedding with Multi-hop Random Walk)。NEMRW首先加入多跳随机游走的方式来获取节点序列。多跳随机游走提高了访问节点时跳出簇的概率,因而可以有效地避免通过随机游走得到节点序列时,所存在的不易获得簇外节点信息等问题。然后,利用skip-gram模型,通过训练fake task最终得到skip-gram模型的隐藏层权重矩阵,即为嵌入结果。同时,NEMRW还利用word2vec中的负采样优化skip-gram模型。本文利用多跳随机游走增加簇外节点的访问概率,达到了增加节点序列所包含的节点信息的目的,使最终得到的低维向量在不均衡的网络上能保存更多信息,避免了基于随机游走的网络嵌入方法在含有簇网络上的局限性。本文最后利用多个数据集,使用本文提出的NEMRW方法进行了嵌入并得到最终嵌入结果,并将其与多种嵌入方法的嵌入结果应用于链路预测和节点分类任务进行对比。同时,用于实验的链路预测与节点分类任务,也正是本文NEMRW的应用场景,因此本文在每个具体任务的实验分析之前,介绍了NEMRW基于该项任务可以应用到实际解决问题的具体应用场景。另外本文还对NEMRW中多跳随机游走的跳数和嵌入维度两个参数进行了实验,讨论了其选择对实验结果的影响。最后,本文通过实验分析了NEMRW的收敛性。以上实验结果表明,本文所提出的方法效果优于其他baseline方法,进而说明本文所提出的网络嵌入方法在不均衡网络中能保存更多的原网络信息,从而更有助于网络数据在机器学习任务上的应用。
其他文献
互联网是一个高速发展的行业,也是一个竞争激烈和快速变化的行业,其软件产品服务模式具有自身鲜明的特点,互联网软件产品一般不受地域限制,面向海量用户,更注重分析用户的行为和反馈,通过持续的软件产品优化、快速交付,为用户提供价值。互联网的这些特点对软件研发管理提出了很高的要求,需要研发组织能够快速响应不断变化的需求,将需求变为可以快速交付的软件产品,为企业的高速发展提供足够的动力。传统研发管理已经很难适
近年来,纳米材料因为其独特的磁学、催化、光学、电学、机械和生物学的特性而受到人们的普遍关注,而且纳米材料在生产生活中都有广泛的应用。其中,二维材料是电子仅仅可以在两个维度上自由运动的纳米材料,例如超晶格、纳米薄膜、量子阱等。而二硫化钼是一种在光电子器件和纳米电子学中具有广阔的应用前景的二维材料。由于开发半导体器件的需求不断增长,二维材料的应变工程最近引起了人们的兴趣,对于各种各样的二硫化钼器件来说
自动提取人脸特征来验证人的身份目前已经被广泛的应用在各种领域,但是人脸识别的效果依赖于人种的不同有很大的波动性。鉴于我国是一个多民族国家,研究不同民族的人脸特征不仅能促进目前的人脸识别和检测,还能通过现代的信息技术手段将:这种特征保存起来,有利于研究民族相互融合、繁衍产生的新特征,更能为民族学、人类学等提供了宝贵的研究资料。神经网络随着2006年Hinton发表的论文火热至今,目前深度神经网络不论
在工程实践中,随着复合材料的广泛应用,对复合材料板壳结构的振动特性分析以及板壳结构与周围声场组成的耦合系统的声振特性分析愈加重要。单一形式板壳结构振动特性的研究成果丰富,但是缺乏通用的统一建模方法简化研究过程。对于复合材料结构-声耦合系统来说,机械波在耦合界面处会产生能量耗散和波形转换等现象,这使得对声振耦合机理的研究变得异常复杂且研究成果相对匮乏。因此,本文先从结构域入手,建立复合材料浅壳结构振
2,4,6-三硝基甲苯(TNT)、2,4,6-三硝基苯酚(PA)、2,4-二硝基甲苯(DNT)等硝基芳烃类化合物是公认的爆炸物,在军用领域得到广泛的应用,对国民生命及财产安全造成严重危害。再者,硝基芳烃类化合物在烟花制造、化工、皮革、医药和染料工业中得到广泛应用,在生产,运输及使用过程中可能发生泄露,对地下水和土壤环境造成威胁。因此,快速识别与检测该类化合物一直是科研工作者的重要课题。在各类爆炸物
目的各种原因造成的视网膜组织细胞损伤最终会导致不可逆的视力下降。减轻疾病过程中的炎症、保护营养视网膜神经细胞是目前多种视网膜疾病治疗研究的热点。间充质干细胞(mes
为满足大容量、高速率、高安全性的数据传输要求,光通信与光互连技术应运而生,并对器件的集成度提出更高的要求。硅基光电集成被认为是集成光电子领域最具发展潜力的方向之一,目前多种硅基无源光器件已被实现。然而由于硅材料自身的缺陷,硅基有源光器件的实现往往需要其他材料辅助,才能满足相应的性能要求。石墨烯是一种六方晶格的单原子层二维材料,已被证实在光、电、热学等领域都有着相当优异的性能。将石墨烯与硅结合可有效
等效原理是爱因斯坦广义相对论的基本假设之一,其成立与否需要高精度实验检验。等效原理实验检验一方面追求更高精度,另一方面探索新的可能破缺机制。本课题组前期提出并进行了不同自旋取向原子新型等效原理检验,在10-7水平上未发现等效原理破缺。本人硕士期间研究工作就是在课题组前期工作基础上,探索不同自旋取向原子等效原理实验检验的新方案,以期提高检验精度。不同自旋取向的原子属于磁敏感态,利用原子干涉法测量其下
目的:EHD2(C-Terminal EH domain-containing protein 2)蛋白是一类参与受体内吞和转运的新型膜转运调控蛋白。据报道EHD2可以与质膜结合,提高其稳定性,并限制其凹陷和内吞囊
具有孪晶结构的金属纳米线因其优异的力学性能而受到人们的广泛关注。然而,之前的研究大多数都集中在共格孪晶界(CTBs)垂直于其长轴的金属纳米线上,而对于CTBs与其长轴平行的纳米线,它们的强化效应以及变形机制尚不清楚。本文采用分子动力学模拟的方法,以面心立方结构(FCC)金属,如:Al,Ni,Cu,Ag,Pt和Au为研究对象,系统地研究了CTBs与纳米线的长轴平行的孪晶纳米线的力学行为。通过对不同厚