面向网络不确定性的图神经网络学习方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:hezeliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的快速发展,为人们对社会生活的研究提供了新的视角。把生物、社交及交通等信息系统建模为由大量相互交互的节点组成的网络,通过网络嵌入和分析技术,可以比传统方法更高效地发现规律和模式。然而,随着以网络为模型的关系数据集的规模不断扩大,其数据获取和分析也充斥着不确定性,基于网络的分析技术在计算和概念上也都具有挑战性。尤其是对于许多网络分析技术如图神经网络而言,网络结构和节点特征都必须是完全已知的。但在很多实际问题中,这些并不总是精确地给定的,很多网络的特征和网络结构都是领域专家基于领域知识构建的,这给模型增添了许多干扰和不确定性,包括由脏数据或者属性冗余导致的特征不确定性和不同特征对节点影响的不确定性;脏数据或数据缺失导致构建的网络结构的不确定性;忽视节点之间的关系强弱导致的节点关系的不确定性。本文将这些不确定性概括为三个方面:节点特征的不确定性、节点关系的不确定性以及网络结构的不确定性。这些不确定性问题除了导致结果准确性不够高以外,还导致基于这些网络建模的模型鲁棒性和泛化性较差。本文从这三个方面的不确定性出发,结合网络不确定性的典型应用场景,对消除网络不确定性的关键技术进行了创新性的研究和探索,具体完成的工作和贡献包括以下几个方面:1.研究了不同特征与节点标签之间影响关系的不确定性。提出一种基于贝叶斯定理的概率图模型,建模节点特征与节点标签之间的概率分布,进而通过该概率分布对节点标签的预测给出一个置信度,衡量不同特征与标签之间影响关系的不确定性。本文以特征不确定性比较突出的社交网络数据量化评估该模型,通过节点特征与节点标签之间的概率分布分析节点特征的不确定性,判断模型对该不确定性的消除。实验结果肯定了对节点特征不确定性的分析和解决思路。2.研究了不同邻居对节点影响关系的不确定性。提出一种特殊的采样机制解决邻域采样的不确定性和一种特殊的图神经网络,可以在邻域聚合时自适应地给节点的不同邻居分配不同权重解决节点关系权重的不确定性,并迭代地更新节点特征。将该模型应用到特征不确定性和网络结构不确定性相对较低的引文网络中,取得了有效的结果,其结果表明了节点关系不确定性会明显影响模型预测的有效性和泛化性,同时表明模型可以有效消除节点关系的不确定性,并有效避免过拟合。3.研究了网络结构不确定性存在的原因和解决思路,提出一种结合贝叶斯定理的图神经网络,在训练过程中利用混合隶属度随机块模型重构网络,同时针对重构网络中节点关系的不确定性,利用相关经验在训练过程中自适应地给不同邻居分配不同的权重,同时解决网络结构不确定性和与其共存的节点关系不确定性的问题。将该模型应用到网络结构不确定性突出存在的交通网络中,取得了较好的结果,解决了复杂时空网络中网络结构的不确定性和时空依赖关系的不确定性问题,并肯定了模型的先进性、有效性和高鲁棒性。4.以空中时空网络为例,研究多种不确定性混杂存在的实例中不确定性消除思路。将空中时空网络建模为异质图序列,然后用异质图级注意力机制消除空间依赖关系的不确定性,同时利用一个卷积子网,控制多头注意力机制中不同注意头提取特征的重要性,并通过训练不同权重将同质图的邻域聚合的嵌入结合起来。然后用序列级注意力机制消除时间依赖关系的不确定性。将该模型应用到多种不确定性混杂存在的案例——航班延误中,取得了较好的结果,证明了模型的有效性,肯定了消除网络不确定性对模型的贡献。综上所述,本文对消除网络不确定性的关键技术和方法进行了深入分析和研究,所提出的相关模型对提高图神经网络的有效性、泛化性和鲁棒性有重要的理论意义和现实意义,能够被应用在实际系统中,获得更高效、准确且鲁棒性高的结果。
其他文献
《俗世奇人》是当代著名作家冯骥才的短篇小说集。冯骥才祖籍浙江慈溪,生于天津。天津的地域文化对他的文学创作和人生道路走向影响很深。《俗世奇人》短篇小说集故事素材或取自天津的民间传说,或来自作者从小到大的生活经验,小说将具有天津特色的人物和风俗写的传神、鲜明、个性。冯骥才在《俗世奇人》之中以人物为中心展开叙述,积极塑造了一批有天津地域性格的“民俗文化人”,冯骥才怀揣着对天津城的热爱,将旧天津纷繁的民俗
目前二语习得的研究发现,学习者的学习成就不仅受到学习者个体智力因素的制约,还受到情感等非智力因素的制约。比如学习者的学习动机,学习焦虑,自我效能,学习风格等。在二语习得研究中,以学习者的个人因素为中心的研究是一个重要的研究领域。而Gardner在2005年提出社会教育模型显示,动机、焦虑与学习者的个人能力是直接影响学习者学习成果的三个因素。因此,学习者个人因素中的动机与焦虑,对学习者的语言习得有着
对于希格斯玻色子性质的测量是如今高能物理学的最重要研究课题之一,而希格斯玻色子和最重的标准模型费米子-顶夸克-之间的汤川耦合常数则是希格斯玻色子性质研究中最重要的一环,此常数可以通过测量ttH产生截面并进行推导得到。本论文使用由ATLAS探测器收集到的大型强子对撞机在质心系能量为13 TeV下质子-质子对撞产生的数据,对ttH过程在多轻子末态下进行了测量,同时还在evμv末态下对超出标准模型的新重
1.研究背景膀胱癌(bladdercancer,BC)是我国泌尿外科临床上最常见的泌尿生殖系统恶性肿瘤之一。膀胱尿路上皮癌是膀胱癌最为常见的组织学类型。在我国范围内,膀胱癌的发病率位居全身恶性肿瘤的第13位,其中男性膀胱癌患者的发病率位居第七位,女性膀胱癌患者的发病率居位第17位。而在全身恶性肿瘤中,膀胱癌的死亡率位居第13位,其中男性膀胱癌的死亡率位居1 1位,女性膀胱癌的死亡率位居16位。根据
本报告以大韩贸易投资振兴公社2020世界流行趋势说明会为对象进行口译模拟实践。在本次实践中,笔者听一段源语之后,再进行口译,源语时长40分钟,最后再将源语内容和口译内容进行文字转写,并进行修改,将自己现场口译译文与修改过后的译文进行对比,分析总结其中的信息缺失内容,并将错误的内容分类归纳,以案例分析的形式进行展开。口译的认知操作模式为多重任务的操作模式,Gile提出了交替传译的认知负荷公式,他将交
“神探伽利略系列”中共有五部短篇小说集,其中包括23部短篇小说。在这23部短篇小说中,与超声波、激光、电子流体、电磁波等科学技术密切相关的小说多达12部。因此东野圭吾对科技犯罪这一题材的关注是显而易见的。以往关于神探伽利略系列的先行研究大多是围绕《嫌疑犯X的献身》、《圣女的救济》等知名长篇小说进行的,而对这一系列中短篇小说的相关研究还不是很充分。根据笔者的调查,还没有解读作品中所体现的东野圭吾科技
随着新课程改革的进一步推广和深入,国家三级课程目标日趋完善。国家课程、地方课程和校本课程越来越一体化,多样化。在国家课程的宏观标准下,越来越多的地方课程资源逐渐被研究并开发出来,不仅符合了中小学生的认知结构特征,也及时补充了国家课程的不足。而地方乡土史作为初中历史教育的一部分也是不可分割的。乡土资源是学生身边的资源,也是学生容易接受的资源。赞皇县的历史悠久,为历史教师运用乡土史教学提供了很有利的条
路易斯·莫罗·戈特沙尔克(Louis Moreau Gottschalk,1829-1869)是美国最早获得国际声誉的钢琴家、作曲家,曾被肖邦预言是未来的“钢琴之王”,他既是美国专业音乐发展初期的代表和奠基者,也是首位采用拉丁美洲和克里奥尔地区民间音乐素材进行创作的作曲家。在美国专业音乐创作一直受到欧洲德奥传统影响时,他的作品体现了对民族音乐的探索。戈特沙尔克将欧洲古典音乐传统与克里奥尔、拉丁美洲
20世纪60年代起至今,被称为日本“SF御三家”的筒井康隆获奖无数,以其前卫的小说作品为文学不断开拓新的疆域。筒井康隆以其鲜有的文学才华准确捕捉并揭示了现实阴影中被轻视或将越发严重化的社会问题。其作品以幽默催人发笑,并不囿于科幻小说的固定思维,以大众喜闻乐见的方式将科幻小说中多见的复杂道理表现出来,不负其鬼才之称。他在作品中批判社会时,总让人觉得批判不过是笑料的添加剂,但细思之后却一定会为其背后表
本研究以参加韩国语能力考试的中国韩国语学习者为对象,根据改革后TOPIK高级阅读文本类型,探索适当的阅读战略。为此,针对TOPIK的阅读文本类型,利用问卷调查和模拟真题进行的调研,掌握中国学习者的阅读文本错误率,以此为基础,提出了符合各文本类型的TOPIK高级阅读战略。第一章分析了研究目的、研究意义和研究方法,在阅读文本类型和TOPIK文本类型两方面进行了研讨。第二章分析TOPIK改革前后考试内容