论文部分内容阅读
互联网应用已深植人类社会的方方面面,网络社交已成为绝大多数人生活中必不可少的元素。大量互联网用户的加入使得社交网络平台汇聚着来自四面八方的信息,如人们的社交关系、行为习惯以及发展轨迹等。互联网中不同的个体通过对应的关联规则相互连接形成了社交网络(Social Networks)因此结构关系就犹如骨架般承载着社交网络,揭示着信息在网络中的传播规律。信息技术的革新催生着智能网络社交服务的发展,简单的信息传播与内容共享已然无法满足当代社交网络用户群体的诉求。纵观社交网络的研究进程,传统的分析方法在一定程度上已经不能很好地适用于复杂网络结构关系的研究。当下,已是深度学习(Deep Learning)为主导的人工智能时代,然而智能化的社交网络结构关系分析仍有待进一步地探索。从图论角度出发的关系挖掘模型依然存在提升的空间,且跨模态、多模态图结构关系挖掘更是鲜有研究者涉猎。因此,本文旨在研究基于深度学习的网络表示学习(Network Representation Learning)技术来挖掘和分析网络结构关系。顺应时代潮流,结合当前相关领域的国内外研究现状,本文具体工作可以归纳为以下三个方面:(1)基于网络邻域空间下结构相似性的网络表示学习方法研究。为了充分利用网络中局部邻域空间的上下文结构属性,本文提出了一种以节点间相似度(Similarity)为指导的基于马尔可夫链游走(Walk)策略的网络表示学习方法(SimWalk)。受基于深度学习的词向量自然语言处理技术的启发,SimWalk利用节点相似度推理出局部网络空间下的概率转移矩阵,从而指导基于马尔可夫链的图结构探索过程。因此,这种类自然语义的节点序列生成方式,更加深了相似节点的共现性和相关性。最终由深度学习模型将上下文结构属性编码到网络表示中。实验结果表明SimWalk生成的网络节点表示能更好地保留网络中的结构关系;(2)基于网络拓扑深度同构子结构特征编码的网络表示学习方法研究。为了应对现代社交网络复杂结构并从网络中习得更加全面的结构关系信息,本文提出了一种面向网络结构关系的深度同构子结构网络表示学习方法,即Deep Isomorphic Substructure Learning(DISL)。根据同构性的子结构划分,DISL令同构单元自嵌于基于节点的子图中,从而保存了潜在的基于几何形态的相似特征。另外,利用SimWalk方法探索网络局部邻域空间的上下文结构,从而保留了局部节点的共现性和相关性。最后DISL采用了卷积神经网络对几何形态特征和局部上下文结构特征进行编码,从而学到更加全面的低维向量表示。实验结果表明,相较于前沿网络表示学习方法,DISL生成的网络表示更能反映网络结构关系;(3)面向富文本信息网络中跨模态结构关系推断的网络表示学习方法研究。由于绝大多数现有的网络表示学习方法在很大程度上必须依赖网络结构中的那些“可观测连接”属性,因此部分有价值的社会关系会因结构的缺失而无法被发现。面向文本信息网络中的社交关系推断任务,本文提出了一种基于生成对抗网络的网络表示学习方法(Social Relation Generative Adversarial Networks,SRGAN),旨在面对结构缺失的文本网络系统时,能有效地利用文本数据推演出有意义的社交关系。SRGAN打破了图模态数据和文本模态数据之间的屏障,通过生成对抗网络,完成文本和图结构信息之间的知识迁移,从而实现对文本模态数据的编码以构建缺失的网络关系,或推理出可能存在的网络关系。实验结果表明,SRGAN可以在富文本信息网络系统中做出更加符合现实的社交关系推断。