基于多阶段非负矩阵分解的异质边网络表示学习研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lollipop1910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络表示学习尝试用低维稠密的向量最大程度保留网络的原始信息,这些向量一般被视为特征,用来执行后续的网络分析任务。节点之间不同类型的关系可以被抽象为异质边,由于每一种异质边代表不同的语义信息,而经典的网络表示学习方法通常处理网络中的同质边,不能很好地建模节点之间的异质边。因此,如何从异质边网络中挖掘复杂结构的信息仍然是值得探讨的课题。为了探索异质边的网络表示学习,通过将每种异质边代表的关系视作网络的一个视角,该视角描述了节点之间特定类型的邻近关系,进而异质边网络表示学习问题被进一步转化为多视角学习问题。事实上,大多数现有的网络表示学习方法都等价于矩阵分解。然而,传统矩阵分解的近似误差通常相当大,因为单个低秩矩阵不足以捕获完整的原始信息。通过梯度提升的多阶段矩阵分解过程,多阶段非负矩阵分解模型渐进式地将上一阶段的残差矩阵进行分解,从而实现了较低的矩阵分解误差。同时,基于多阶段的模型结构,多阶段非负矩阵分解模型设计了两种不同的非负矩阵分解方式。其中,统一的非负矩阵分解通过对多个视图的相似度矩阵进行联合分解,从而保存不同视角之间的一致性信息;独立的非负矩阵分解通过对每个视图的相似度矩阵单独地进行分解,从而保存每个视角的独特信息。最后,将每个阶段学习到一致性信息和独特信息的向量表示进行串联,获得网络中所有节点的最终向量表示。实验结果验证了通过多阶段非负矩阵分解方法学习到的异质边网络的向量表示,在多个任务上的实验效果均优于现有的方法。在多个真实世界的数据集上进行的节点分类实验中取得了超过2%的准确率提升;在节点聚类实验中取得了大约1.5%的互信息分数的提升;在网络可视化任务中,不同社区中的节点分布差异可以更加明显的展示出来。同时,实验还验证了多阶段矩阵分解的合理性以及有效性。
其他文献
随着可再生能源的广泛开发利用,风能、太阳能等新能源在能源结构中的占比不断提高。而负荷侧,电动汽车、变频空调等直流负荷越来越多,这导致电力系统负荷结构产生了新的形态。在上述背景下,传统配电网结构正逐步由交流配电网步入交直流混联配电网。其交流配网侧保留了传统配电网的技术优势,直流配网则具备输电效率高、利于分布式电源(Distributed Generation,DG)接入等特点,已成为未来电网的重要发
在大规模时序数据流中实时识别完整事件趋势(CET)在金融服务、实时商业分析和供应链管理等应用中具有重要作用。在完整事件趋势识别过程中可能产生大量中间结果,这些中间结果为CET识别系统带来巨大时空开销。目前国际上最新的方法设计了一种压缩图模型。在这种压缩图中,CET被表示为压缩图中一条路径,不同CET的相同子序列通过图中共同路径进行共享存储。此方法消除了中间结果冗余存储,使得内存空间利用更加高效。然
在过去数十年中,研究物质的拓扑能带性质一直是凝聚态物理学中的热点问题之一。而在最近,一种新型的拓扑相-高阶拓扑绝缘体成为了理论和实验广受关注的焦点,其原因在于它所体现出来的奇异的体-边对应关系。然而,当前已提出的若干高阶拓扑绝缘体的物理模型对格点间的跃迁系数有较苛刻的要求,使得在常规的电子材料中难以被物理实现。针对这一困难,我们在本文中提出基于超导量子电路物理体系的高阶拓扑量子模拟。量子模拟是利用
RNA剪接机器由5个小核核糖核蛋白(Small nuclear ribonucleoproteins,sn RNP)复合物组成。每个剪接复合物由多个蛋白组成,这些蛋白质称为剪接因子。SRSF2(Serine and arginine Rich Splicing Factor 2)属于SR蛋白家族,在pre-m RNA到成熟m RNA的剪接加工中发挥重要作用。近年来的研究表明,SRSF2可能在血液系
半导体材料在科技领域发挥着极其重要的作用,近年来光电半导体材料也得到了重点关注和投入。制备多功能集成和高精度响应的光电半导体器件已成为光电检测和光学计算的普遍发展趋势。由于常规的正光电导器件很难满足人们的需求,要想在光电检测、光芯片和光计算等相关领域实现重大突破,研究负光电导效应具有重要意义。但是,迄今为止很少有研究者报道室温下具有超大电流降、大关/开比和超快响应速度的负光电导器件。本研究针对这一
随着高速无线传输需求的增加,新的通信系统需要比以往具有更宽的带宽和更快的传输速率。E波段由于具有较低的大气衰减,近年来备受关注,其中71–76 GHz和81–86 GHz已经成为毫米波点对点通信和数据回传的应用频段。为了满足点对点通信系统对于高增益、低剖面、窄波束天线的需求,本文基于金属腔体辐射结构开展了E波段高增益平面阵列天线的设计研究,具体工作如下:1.基于E波段点对点通信对于高增益、低剖面阵
近年来,随着航空航天、新能源汽车和船舶重工等领域的快速发展,工业界对金属材料提出了大型化、复杂化、轻量化等新需求。颗粒增强铝基复合材料具有质量轻、比强度高、比刚度高、耐腐蚀、耐磨损以及易成型等优良特性,应用十分广泛。激光熔覆成形技术可以成形大尺寸复杂构件,具有工艺简单、工序少、成本低、加工周期短、可加工材料种类广泛等优势。因此,利用激光熔覆成形技术制备高性能的颗粒增强铝基复合材料成为了近年来学者们
随着光伏产业的发展,光伏玻璃需求量更大,生产线效率需求更高,加工工艺更严苛。传输作为光伏玻璃流水线生产必不可少的环节,往往被视为提升产能的重要节点。在逐渐严苛的效率要求和特殊工艺等多因素制约下,仅由单一电机驱动的传输方式有时无法满足需求。相应的,出现多电机高速同步传输解决方案,其同步精度直接影响加工的质量与效率。因此,研究多电机的同步控制技术具有重要意义。本文以校企合作项目“大幅面光伏玻璃智能激光
知识图谱是由实体作为节点,实体之间的关系作为边组成的图。知识图谱问答是最近几年一个被广泛关注的方向。知识图谱问答,就是给定一个问题,在知识图谱中找到相应的答案,而根据在知识图谱中推理的次数,又分成单跳推理和多跳推理。单跳知识问答仅需在主题实体相邻的一跳内搜索答案即可得出结果;多跳知识问答需要在知识图谱进行多个“跳跃”。相对于单跳推理,多跳推理更为复杂。总的来说,知识图谱问答主要面临以下问题:一是知
推进轴系是船舶动力系统的核心组成部分,轴系校中方案是轴系校中安装的理论基础。校中不良的轴系在自航时可能产生振动过大或轴承高温报警等事故。研究显示,合理校中设计方案对润滑特性与振动性能的影响规律或好或坏,并不明晰。因此难以从单一性能设计中对其进行把控。显然,舰船轴系校中、润滑与振动性能相互作用,而传统合理校中仅从单一特性优化,难以得到多性能综合作用下的优化结果。为此,本文从轴系校中、润滑与横向振动的