基于对抗学习的网络表征方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:glacier000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为表征学习的一个重要领域,网络表征学习成为网络科学和数据挖掘领域的重要研究问题。经典的网络表征学习方法主要可以分为基于随机游走的方法、基于矩阵分解的方法和基于自编码器的深度学习算法三大类。其中,基于自编码器的深度学习算法虽然可以有效的发挥深度学习的强表示能力,但是存在两大严重问题。首先,该类算法的输入维度和所采用的深度自编码器的结构通常都与网络的规模严重耦合,因而无法高效的应用于大规模网络的表征学习。其次,该类算法通常无法有效的结合网络的拓扑结构和节点的属性。近期提出的图神经网络,尤其是卷积图神经网络,虽然可以有效的缓解前面提到的计算效率和融合异构信息的问题,但是通常需要监督信息(即部分带标签的节点)辅助模型的学习。这使得图神经网络无法直接被用于无监督的网络表征问题。因此,为了使图神经网络可以被用于网络表征,本学位论文主要研究图神经网络的无监督学习问题。具体地,本文开展了如下两方面的研究:第一,高效利用生成对抗机制进行图神经网络的训练。通过借鉴博弈的思想,生成对抗网络令生成器和判别器相互对抗博弈,从而可以无监督地探索潜在语义空间并通过扰动分布捕获数据分布中的语义变化。为了网络表征学习中高效利用生成对抗机制的这一特性,本文将生成对抗网络扩展为具有编码器(表征学习器)、生成器和判别器三部分的网络。编码器利用图卷积网络对输入的属性网络求解节点表征,生成器从混合了噪声的节点表征生成网络的拓扑和节点的属性,判别器用来区分由拓扑、属性和表征三者组合成的信息是来自于真实数据还是生成数据。通过判别器、生成器和编码器之间的博弈对抗,无监督的训练编码器做的图卷积网络。实验表明该模型在中小规模真实网络上获得了显著的性能提升,在大规模网络上却不尽如人意。第二,利用注意力机制提升基于图神经网络的网络表征能力。通过研究发现上一个研究中的方法在大规模真实网络上问题主要是由于所采用的作为编码器的图卷积网络自身的表示能力的缺陷。为了解决这个问题,我们将图卷积网络编码器中的固定传播权重改进为基于注意力机制的可学习的权重。同样利用上一个研究中的基于对抗机制的无监督训练方法,算法可以得到更具表达能力的编码器,从而使节点的表征更能体现数据分布中的语义变化。实验验证了改进的算法在各类网络上的聚类和链接预测任务中超过了最先进的方法。
其他文献
情感分析指通过计算机手段对网络评论文本的情感进行挖掘、识别和分析的过程。本文首先针对中文文本复杂性高的问题,提出了一种有效的关键句提取算法。然后针对单一分类器具有局限性和不稳定性的问题,提出了一种基于规则选择的基分类器集成算法,并将该算法应用于基于关键句的文本情感分析中。在传统关键句提取算法的基础上,提出一种融合全局特征和自身特征双窗口加权Text Rank关键句提取算法(Weighted Tex
学位
随着科学技术的发展,在神经网络、区块链等诸多领域中出现了越来越多的大规模超多目标优化问题,而传统演化算法针对此类问题难以获得较高的优化效率。因此,需要改进目前已有的策略并设计新颖的算法。本文通过研究、改进和有效组合多个已有的演化算法,提出两个改进的大规模超多目标演化算法。随着数据日益复杂多样,从这些数据的特征中选择具有较强代表性的特征存在一定的困难。因此,研究如何解决特征选择优化问题具有现实意义。
学位
中共十八届三中全会通过的《中共中央关于全面深化改革若干重大问题的决定》,允许农村集体经营性建设用地出让、租赁、入股,实行与国有土地同等入市、同权同价。2019年8月26日,全国人大常委会修改通过的《土地管理法》第63条规定“土地利用总体规划、城乡规划确定为工业、商业等经营性用途,并经依法登记的集体经营性建设用地,土地所有权人可以通过出让、出租等方式交由单位或者个人使用”,这是法律对集体经营性建设用
学位
随着互联网的迅速发展,越来越多的用户喜欢在网上表达自己的观点和想法,这就积累了海量的文本数据。对这些文本数据进行情感分类,可以挖掘这些文本数据的潜在信息,从而可以帮助平台以及其他行业的发展。在情感分类的过程中,主要是对互联网中产生的文本数据进行分析并做出情感倾向判断。这一过程往往需要大量带标签的文本资源,但是由于不同语言之间的数据资源差异导致情感分类在不用语言之间发展不平衡。这一现状,促使了跨语言
学位
在市政道路建设施工中不可避免的设置大量的雨水井、污水井、燃气等类型的检查井,检查井的施工质量将直接影响了道路交通车辆行驶的舒适性和安全性。针对此,本文主要分析球墨铸铁可调式防沉降检查井盖安装技术,并从安装流程、工艺关键环节进行探究,并提出井圈周边加固施工工艺后,减少了井周路面开裂、下沉和破损,减少了井盖松动噪音扰民等病害,对城市管理在一定程度上起了积极的影响。
期刊
专利背景技术包含丰富的技术问题信息,能帮助我们快速了解当前技术的核心问题,在专利推荐方面具有重要价值。目前专利推荐主要是基于专利内容进行推荐,缺乏对技术问题具有针对性的推荐,且专利技术问题的相关研究甚少,无法展示专利多元化的问题信息。本文从专利背景技术中入手,采用先筛选后抽取的两步骤策略抽取出结构化的专利问题信息,并进一步利用问题信息结合专利标题表示专利特征向量,提出了一种基于多元问题信息的专利聚
学位
人体动作识别是分析视频中个体的动作和多人之间的互动行为。作为高级信息的骨架序列可以传达人类活动的紧凑信息,为描述人体动作提供有效的表示。图卷积网络(Graph Convolutional Network,GCN)通过将人体骨架构建为一个时空图,取得很好的分类结果。然而,大多数现有图卷积方法忽略了关节点之间的非物理依赖性,也没有充分考虑不同人体关节点和视频帧的重要程度。因此,对于基于骨架的人体动作识
学位
当今是全球一体化的时代,跨区域合作成为主流,是现阶段中国经济发展的重要特征。国家、省域、市域之间的依赖性与纽带不断强化,彼此相互合作,且相互竞争。基于此,形成的以政府间竞争为主要特征的区域治理模式和体制机制为区域协调发展战略提供了强劲的推动力,也为地方政府指引了一条纾解区域经济协调发展难题的有效路径。区域政府协同治理已取得骄人的成绩,但同时,也要清楚地了解到,我国区域发展差距依旧较大,难以适应新时
学位
本文主要介绍统计决策在风险型和不确定型两种类型决策问题下的决策方法。主要介绍在风险型决策问题下的分别以期望值、等概率、最大可能性为标准的决策方法,以及在不确定型决策问题下的“好中求好”“坏中求好”和α系数决策方法,并且对上述各种决策方法进行归类总结,阐述各种决策方法的内容和手段,并通过一些具体实例来反映实际中的应用。
期刊
目前,互联网上的三维模型不仅在数量等级方面以指数的方式迅猛增长,而且与二维图像相比三维模型组成的场景包含更加丰富逼真的视觉细节,使得三维模型这一信息载体在建筑设计、造型艺术、动画制作以及零件生产加工等方面发挥了重要的作用。在海量的模型数据库中高效准确地检索到用户所需模型,具有重要的研究价值。三维模型的检索算法主要可以概括为两类:基于模型特征和基于视图特征。基于模型特征的检索主要是从模型的三维数据角
学位