论文部分内容阅读
随着信息技术与互联网技术的不断突破,包含关联交互关系的网络化异质数据爆发式增长。这些数据描述了不同类型对象和它们之间的复杂关联关系,相互关联的对象及其交互关系构成了无处不在的异质信息网络。异质信息网络具有结构非线性、交互高阶性、信息多样性和动态性,且蕴含丰富的语义信息,难以对其进行合理高效且捕捉语义信息的统一表示,导致在对异质信息网络进行分析挖掘及应用时出现瓶颈。本文研究异质信息网络中面向事件语义的网络表示学习,旨在学习异质节点的低维稠密向量化表示,同时最大程度保留原网络蕴含的事件语义信息,从而突破传统基于原始邻接矩阵表示进行网络分析的固有研究范式,成为大数据时代下对异质信息网络进行分析及应用的有效手段。论文选题来源于北京市教育委员会共建项目子课题——“基于大数据的异构信息网络的信息传播及演化机理研究”和“基于社交感知的跨媒体数据分析与挖掘研究”。论文围绕异质信息网络中面向事件语义的网络表示学习进行了深入研究,针对异质信息网络的四个特性,包括结构非线性、交互高阶性、信息多样性和动态性,分别提出了相应的面向事件语义的网络表示学习方法。论文的主要贡献下:(1)针对如何保持异质信息网络中存在的非线性网络结构,以学习蕴含事件语义的节点表示的问题,研究保持结构非线性的网络表示学习,提出了一种基于深度超限学习机的网络表示学习方法。本方法构建由多层非线性函数组成的深度模型来捕获非线性的网络结构,同时设计优化函数来捕捉基于节点一阶和二阶邻近度的事件语义信息,并结合超限学习机以提升深度模型的计算效率。实验结果表明,本方法在网络重构和节点分类任务上相较于传统浅层模型有性能提升,并且在训练运行速率上是传统深度模型的1.8至4.5倍。(2)针对如何保持异质信息网络中存在多节点间的高阶交互,以学习捕捉复杂事件语义的节点表示的问题,研究保持交互高阶性的网络表示学习。一方面,针对异质信息网络同时存在的事件内节点间高阶交互关系和事件间相关关系,为了捕捉这两种关系蕴含的多层次事件语义,提出了一种基于异质超图的网络表示学习方法。另一方面,针对异质信息网络同时存在由多种事件下的节点间高阶交互关系,就如何捕捉多视角下的事件语义信息,提出了一种基于元结构的网络表示学习方法。实验结果表明,本研究提出的方法所学到的节点表示向量可以有效服务于节点分类、聚类和可视化任务,且性能比现有方法均有提升,证明了这些方法通过对网络结构的高阶交互关系建模,可有效捕捉蕴含于网络结构的事件语义信息。(3)针对如何融合异质信息网络中的节点原始内容以学习可进一步捕捉事件语义的节点表示向量的问题,研究融合节点原始内容的网络表示学习,提出了一种基于深度异质超图嵌入的网络表示学习方法。本方法将网络构建为异质超图,并设计面向节点原始内容的深度编码器模型以从原始节点内容提取视觉特征,然后提出了一种融合节点原始内容的深度异质超图嵌入模型,将不同类型节点嵌入到低维潜在空间中,并将潜在空间的节点表示和编码后的视觉特征统一到同个框架中,从而实现在节点表示中捕捉全面的事件语义信息。实验结果表明,本方法对于图像分类、组群推荐和跨模态检索的应用上效果明显,且在图像分类任务上相较于对比方法性能提升至少22%,证明本方法可以有效融合节点原始内容,学习到捕捉事件语义的节点表示向量。(4)针对如何借助异质信息网络的多种信息以学习适应网络动态变化且捕捉事件语义变化的节点表示向量的问题,研究融合多信息的动态网络表示学习,提出了一种基于多任务序列到序列学习的归纳式网络表示学习方法。本方法设计新的异质随机游走方法以捕捉基于序列的事件语义信息,并将网络表示学习问题转化为一对多的多任务序列到序列学习问题,以支持归纳式学习,从而当新节点加入时可快速推断出其表示。实验结果表明,本方法在动态网络的节点分类任务上相对于对比方法性能至少提升5%,证明本方法对于可以有效泛化到动态网络中新增的节点,学习到捕捉事件语义的节点表示向量。