基于多源交互融合的跨网络实体对齐方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lionpb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能设备的普及和移动互联网的发展,海量的用户行为信息在网络上产生。同时,随着各种平台的兴起,一个用户实体可能同时在多个平台注册账户,各个平台之间的联动性增强,网络数据呈现出跨平台的特性,海量数据场景下局限于单一网络的分析和挖掘已经不能满足目前的实际应用需求。通过网络实体对齐技术在海量的网络节点中挖掘出不同网络中对应同一现实场景中的人与物,对于跨网络推荐系统、跨网络犯罪追踪以及跨语言翻译等具有重要的意义。一方面,网络结构数据庞大的节点规模、拓扑结构、关系分布的多样性和不均衡性使得现有的网络表示学习方法难以学习和提取到高效的特征信息。另一方面,网络的虚拟性和不同网络间的跨领域特性使得实际场景下跨网络标记训练数据难以大量获取,严重限制了现有监督类算法和模型的实际应用能力。因此,本文将从网络表示学习和实体对齐两个层面展开研究:首先,本文从网络数据特征提取和表示学习方面展开研究,对目前的网络表示学习方法进行深入分析,并从异质网络中节点之间交互的多样性和邻域节点的层次性入手,提出一种多源交互融合网络表示学习模型。将节点邻域分为一阶邻域和高阶邻域,分别通过本文提出的一阶邻域信息聚合算法和高阶邻域信息聚合算法进行信息聚合,然后利用本文提出的多阶邻域信息融合算法进行信息融合。利用开源的真实数据在多种下游任务上对方法进行了验证,实验结果表明,所提出的方法相比现有的方法在各类指标上均有不同程度的提升。其次,本文基于在网络表示学习层面的研究基础,对目前的网络实体对齐方法进行深入分析,从实际场景下跨网络实体对齐标记数据难以大量获取的现实问题出发,提出一种残差循环对抗实体对齐方法。利用本文提出的残差对抗实体对齐模型实现了无监督场景下的实体对齐学习,在此基础上,利用重建损失模型和循环对抗模型对其进行了优化。在真实数据和生成数据上对所提出的方法进行了验证,实验结果表明,本文提出的方法相比目前的方法有较大提升,无监督学习的特性也提升了模型在实际场景下的应用能力。最后,本文基于在网络表示学习和网络实体对齐两个方面的研究成果,结合实际的应用场景需求,设计并实现了一套跨网络实体对齐原型系统,从实际应用中验证了本文研究内容的可行性。
其他文献
非晶合金纤维具有优异的高硬度、优异软磁性能、优异的电性能以及耐磨损等良好的性能,然而,该材料的室温拉伸性能可靠性不高,这极大影响其应用前景。因此,研究非晶合金纤维经不同方法处理后的变形行为机理,有利于提高其性能可靠性。本文选择Cu47.5Zr47.5Al5合金作为研究对象,通过熔体抽拉法制备Cu47.5Zr47.5Al5非晶合金纤维,从成型过程中的前处理和成型后的后处理两个角度来开展本课题研究,采
自20世纪八十年代初在美国首次发现艾滋病(获得性免疫缺陷综合症)以来,人类免疫缺陷病毒(HIV)在世界范围内迅速传播,不久便蔓延到各大洲,严重危害了人类健康。据卫生部最近一次的公布数据显示,艾滋病已成为死亡率最高的传染病之一,其对人类生命安全的重大威胁引起了世界卫生组织和世界各国相关政府部门的高度重视。因此对于HIV的感染机理,传播规律以及预防策略的研究成为各国医学家、生物学家及数学家的热门课题之
自石墨烯发现以来,由于其在室温下具有极高的载流子迁移率,在电子器件领域具有广泛的应用前景。然而石墨烯是零带隙半导体,当实际应用于逻辑电路,尤其是场效应晶体管中时,电流的开关比小。不同的石墨烯制备方法以及制造工艺造成石墨烯实际的载流子迁移率较低,这些导致石墨烯场效应晶体管无法满足正常的工作要求。基于此,本文利用油酸铜的油酸溶液在保护气氛中的低温热分解,成功制备出具有一定禁带宽度的石墨烯/铜复合纳米片
海洋不仅蕴含丰富的资源,而且极具战略价值,作为海洋通信的有效方式,高速可靠的水声通信受到各国的广泛重视。由于海洋环境复杂多变,信道衰落严重影响了通信的质量,准确的信道估计算法有助于接收端信号的正确恢复,基于压缩感知的信道估计算法由于能够快速有效地估计出水声信道的状态信息成为研究热点。本文采用MIMO-OFDM技术搭建系统仿真模型,对压缩感知信道估计算法进行仿真研究。论文的主要工作包含以下方面:首先
嫩江是东北重要的流域,影响附近区域的经济发展,但是针对嫩江上游水质理化指标和浮游、沉积生物群落的研究较少,所以对嫩江水质监测平台的优化势在必行。本论文将嫩江上游某一断面作为研究对象,研究近几年的水质变化情况,研究并对比了汛期和非汛期水生生物群落的情况,探究了水质理化指标和水生生物群落之间的相关性,为建立含有生物指标的水质监测平台提供一定的理论依据,为嫩江流域汛期、非汛期的水质监测工作提供基础。收集
我国染料行业目前发展迅速,废水处理的难度逐渐增加,巨量染料废水的妥善处理成为该行业发展的瓶颈。本课题研究结合了传统吸附法和光催化降解染料废水的处理技术的优缺点,设计了膜吸附和光催化再生的耦合体系,膜吸附体系,利用CCTP复合膜上的功能性基团针对刚果红进行选择性的高效吸附。光催化体系,利用负载CCT材料良好的光催化性能,实现膜表面吸附刚果红的降解去除,光催化膜得以环保再生并继续循环使用。通过两个体系
智能手机的普及给人们的生活带来了翻天覆地的变化,因其强大的处理能力成为了人们不可或缺的工具。在人们享受便捷的同时,借助智能手机实施犯罪也使人民的生命财产安全遭受威胁。为解决这个社会问题,手机取证技术应运而生。由于嫌疑人需要借助各种手机APP整个违法犯罪流程,因而他们在手机上的操作流程成为了执法部门关心的问题。本文基于市面上广泛使用的Android操作系统,对系统运行机制进行分析,利用提取的内存镜像
随着移动通讯技术以及智能应用软件的普及,智能手机已经承载了通讯、商务、娱乐等多种服务,极大提高了人们生活的便利性。智能手机的强大功能在改变人们日常生活的同时,也为不法分子实施各种各样违法犯罪活动提供了便捷。不法分子使用的智能手机中存储的应用程序数据,可能与他们的违法犯罪行为有关。因此,通过对不法分子使用的智能手机进行取证,搜集重要的证据信息,这对公安机关和司法机关打击违法犯罪行为起着非常关键的作用
近年来,越来越多的软件以微服务的形式存在于互联网中,服务种类日益多样化、服务数量迅猛增长,为开发人员缩短研发周期、提升产品质量带来了极大的方便,但同时造成了依靠用户手工查找所需服务效率不高的问题出现。因此,为了有效利用服务提供商的资源,提高用户对所需服务的查找效率,改善用户满意度,本文将对服务组件库的构建进行定义,在服务组件库的基础之上展开服务需求发现方法、服务推荐方法和服务组合调度方法三个阶段的
超滤膜分离技术是水处理领域中一种新颖的净化方法,具有高效、操作方便、自动化程度高、适应性强等优点。但是随着工业的发展和城市人民生活水平的提高,水中有机微污染物在种类和数量上都呈现出快速上升的趋势,有机微污染物对水生生物和人体都将造成难以预估的危害。传统的超滤工艺由于膜孔径的限制,对有机微污染物的截留较差,同时膜污染问题也限制超滤技术的应用和推广。高级氧化技术(AOPs)因其出色的氧化能力,在给水和