基于GNN的异质网络重叠社区发现算法研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:zuochangfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区发现是将网络中的节点通过某种划分方法化分成多个社区。研究早期,研究者将现实中的网络抽象为同质信息网络,即节点和边都是同一类型的网络,并提出许多传统同质信息网络社区发现方法。但现实世界中的网络多为异质信息网络,即节点和边为多种类型的网络。同质信息网络社区发现方法适用于异质信息网络,但社区划分准确率较低。研究者发现,现实世界中的社区大多是重叠社区,因此在异质信息网络进行重叠社区发现不仅可以利用丰富的语义信息还可以使社区发现结果更具有真实性。传统社区发现方法大多只根据节点的结构信息或者节点的属性信息划分社区。研究者发现,图神经网络(Graph Neural Networks,GNN)可以将网络的结构信息和节点属性信息结合,同时进行学习,传统的图神经网络在同质信息网络社区发现问题表现较好,但不能利用异质信息网络不同节点类型和边类型的特点,不能较好利用异质网络的语义信息。本文基于图神经网络并且根据异质信息网络的特点,提出基于异质图注意力网络的重叠社区发现方法,其中贡献有以下几点:1、为了充分结合异质信息网络结构信息和属性信息,首先需要构建异质信息网络的特征表示。传统图神经网络只适用于同质信息网络,将同质信息网络节点的结构信息与属性信息结合进行特征的表示学习,并将生成的低维特征空间表示用于下游数据分析。为了利用异质信息网络不同类型节点的特点,首先将异质信息网络节点的结构信息根据指定元路径构建节点矩阵表示,然后将不同元路径的结构信息和与属性信息结合构建异质信息网络的节点特征表示;2、为了充分挖掘异质信息网络,采用改进的异质图注意力网络进行节点特征提取。异质图注意力网络是将图神经网络与注意力机制结合,通过节点级注意力机制获得基于元路径邻居节点的权重信息,通过语义级注意力机制得到不同元路径的权重信息,并将所有权重信息进行融合得到新的节点特征向量,充分挖掘异质网络中不同的语义信息。本文改进异质图注意力网络中语义级注意力机制的激活函数,解决梯度消失问题,并将节点特征向量与后续生成的社区隶属矩阵一同学习。3、为了进行重叠社区发现,将异质图注意力网络与图卷积神经网络结合并基于伯努利-泊松模型统一重构损失。将异质图注意力网络生成的节点特征向量通过图卷积神经网络生成社区隶属矩阵,并将可优化重叠社区的伯努利-泊松模型的负对数似然函数作为损失函数统一优化节点特征向量和社区重叠度,使伯努利-泊松模型可用于异质信息网络重叠社区发现,并通过社区划分的阈值得到最终社区划分结果。本文选取了2个真实异质信息网络数据集DBLP和IMDB和2个同质网络数据集F1、F2,并与传统社区发现算法SLPA,改进的异质网络重叠社区发现算法NELPA和其他基于图神经网络的图卷积神经网络、图注意力网络、异质图注意力网络、NOCD算法进行对比实验,并使用改进的扩展模块度EQ*值作为异质信息网络重叠社区发现的度量指标,EQ作为同质网络社区发现评价指标。实验结果表明,本文提出的模型相比传统社区发现算法和基于图神经网络的算法都有一定程度的提升。并且分析经过训练得到的元路径权重信息,可表明基于改进的异质图注意力网络得到的元路径权重信息符合现实世界对语义信息的理解。
其他文献
互联网技术的日臻成熟促使社会化媒体平台蓬勃发展。由于社会化媒体能够打破信息传播的时空限制,消费者能高效快捷地浏览搜集到大量品牌信息,对产品的选择范围有所扩大。基于此,如何吸引消费者的视线,刺激消费者参与品牌活动创造营销价值,培育具有高品牌忠诚度的消费者,成为企业必须重视和攻克的重要议题之一。为提升营销效率,积累品牌资产,越来越多的企业发起社会化媒体营销活动,以此来了解用户需求,优化产品改进服务,为
学位
<正>2022年9月7日,云南省召开“云南这十年”——生物多样性保护专场发布会。党的十八大以来,云南林草部门正确处理保护与发展的关系,持续开展森林草原资源科学培育、保护和利用,生物多样性保护成效显著。10年来,云南林草生态持续向好,森林面积从2.84亿亩增长到3.03亿亩,森林蓄积量从16.93亿立方米增长到20.96亿立方米,草原综合植被盖度79.1%,湿地保护率57.77%。云南林草部门开展多
期刊
当今世界,创新无处不在。它能够为企业持续高质量发展提供动力,让国家经济实现繁荣昌盛。在国际局势日益动荡、以美国为代表的西方世界国家不断打击我国国际贸易的背景下,如何自己掌握科研研发的主动权已经成为了国家与企业发展的关键任务。而在这样的背景下,如何提升企业创新绩效成为我国后疫情时代推动经济高质量发展的关键性问题。基于此,本文以2009-2017年的A股上市公司为样本,从资源基础理论和资源依赖理论的视
学位
内蒙古自治区有着中国面积最大的草原生态系统,也是内蒙古的地域特色之一。但近年来由于过度放牧、火灾、工业污染等因素导致荒漠化现象日益严重,因此草原环境的保护是当下刻不容缓需要解决的问题。本文将利用WSN技术对草原环境进行监测,但WSN在实际监测过程中,往往会出现数据采集精度低、生命周期短、传输不稳定等一系列问题。为解决上述问题,本文通过把神经网络数据融合算法引入到WSN中来,并设计非均匀分簇路由算法
学位
在数据为王的新时代,数据反馈在很多领域均得到了长足发展。伴随大数据、人工智能技术的发展,出于自我反省、自我完善、自我提升的目的,越来越多的消费者开始利用可穿戴智能设备和智能监测类应用服务追踪其参与活动或行为状态的相关数据,消费者在获取这些数据反馈的同时会根据数据反馈的结果调整自己对应的行为。如部分消费者会根据KEEP、咕咚等健身领域应用服务的数据反馈,调整自己的健身课程和健身时长;还有消费者会根据
学位
动基座光电跟踪系统能够灵活、实时地获取图像信息,并且与国家国防建设、战略侦查以及天文观测等多个重大应用领域有着密切的联系。因此提高系统的跟踪精度、抗干扰能力是十分必要的。本文针对某两轴两框架的光电跟踪系统,利用图论和矩阵论的思想建立多运动机构拓扑结构模型。从多电机协同控制角度出发,主要研究系统的鲁棒性问题、一致性跟踪控制问题以及分布式优化问题,并通过MATLAB仿真证明所提策略的有效性。(1)动基
学位
教师评价是推动深化高等教育领域综合改革的重要路径,随着高校教育教学环境的不断变化,单一固定的教师考核评价标准已经越来越难以适应现代化教育体制。桂西北应用型本科院校艺术设计教师评价要求目的性、针对性、动态性,但教师评价体系仍存在考核评价的核心理念模糊、考核评价标准过于保守、考核评价方式狭窄、忽略了地区院校和专业的特性等不足。本文提出了桂西北应用型本科院校艺术设计教师发展性评价实践思路,包括树立以教师
期刊
中国式现代化是应对世界之变、时代之变、历史之变的中国方案,释放了中国特色社会主义制度和治理体系的优越性,实现了中华优秀传统文化的创造性转化和创新性发展,推动了现代化的理论和实践创新,走出了和平发展的现代化新路。现代化道路在世界不同国家和地区呈现多样性,探索符合自身国情和客观实际的现代化道路是各国的重要课题。日本是“后发赶超型现代化”的典型,也是陷入“赶超后困境”的实例;中东国家很早就开始探寻适合自
期刊
内部审计既是规范国有企业管理的一项重要手段,也是统筹经济发展的一项重要监督方式。本文通过分析新形势下国有企业成本与收入核算、债权债务管理、内控制度建立与执行三个方面综合探寻国有企业内部审计发展思路。在开展内部审计过程中,国有企业主要负责人履职尽责,逐步实现政企分离,促进国有企业转型升级,对国有企业发展具有重要意义。
期刊
报纸