基于深度学习的网络表征研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wangxiaomax
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络作为一种很常见的数据形式遍布于我们的日常生活,包括社交网络、交通网络以及生物网络等。这些网络中的节点与连边都蕴含着丰富的语义信息,通过对它们的分析,我们能够洞悉社会的结构、协调交通的运作以及探清生物间的依赖关系等。然而原始的网络数据可能规模十分巨大,这使得数据的存储与处理都变得困难起来。并且我们常见的数据挖掘与机器学习方法通常不能直接应用到网络这种非结构化的数据形式上。因此,为了方便数据地存储与处理,同时为了使后续的节点分类、节点聚类、链路预测以及可视化等任务得以有效地施展并取得更好的效果,网络表征学习吸引了学术界与工业界大量的关注。本文聚焦网络表征,旨在将每一个节点从原始的高维邻接矩阵映射到一个新的低维空间中,同时尽量保留对于后续机器学习任务重要的信息。常见的网络表征学习方法通常有基于因子分解的方法、基于随机游走的方法以及基于深度学习的方法三种类型。前两者本质上都是通过分解高阶相似度矩阵来求解节点的表征,而后者则主要通过使用自动编码器这一广泛用于数据降维的方法来压缩提取经过加工的节点原始表征实现。另外,针对节点带有额外属性信息的网络数据,前三类方法都各显神通有着各自的扩展,更前沿的,近两年的不少工作都通过尝试将计算机视觉中经典的卷积神经网络迁移到网络数据取得了可观的成效。本文提出的方法是后两类方法即随机游走策略和深度学习方法的结合,其研究内容与主要贡献如下:第一,原始的随机游走策略有着陷入停滞的危险,且其产生的游走序列边界处的节点的上下文信息很难得到正确的捕捉。针对这一问题,我们引入并微调了PageRank算法中带重启的随机游走策略,用于提取拓扑网络中节点间的相似度信息,使得高阶信息得到更准确的表达。第二,之前的网络表征方法要么忽略了节点的标签信息,要么通过与支持向量机联合训练的方式使得最终的表征仅在支持向量机目标模型下表现良好。针对这一问题,我们应用度量学习的策略,在自动编码器提取拓扑相似性信息的同时融入节点的标签信息。由此,我们提出的TEA模型不仅能够利用深度神经网络的非线性特性捕捉网络的复杂结构,虽为一种半监督模型,却能通过三元组损失学得监督信息,从而保留节点之间的区分性信息。并且,TEA模型是与后续具体任务中所用到的模型解耦的,无论后续的任务采用什么模型,都能够得到稳定的效果。第三,我们将TEA模型成功地拓展到了属性网络,通过结合网络种节点自有的属性信息,扩展后的TEA+算法在充分挖掘网络拓扑信息的同时,利用经典的拉普拉斯方式进一步增强了网络表征中所蕴含的信息丰富程度,一定程度上使获得的表征满足网络拓扑信息与节点属性信息的一致性与互补性。
其他文献
随着计算机技术的快速发展和进步,软件被越来越多地应用到各行各业中,几乎已经成为每个人生活中必备的工具。在软件行业快速发展的同时,二进制分析技术和逆向工程技术也在快速的发展和进步,目前已经有成熟的自动化逆向工具集出现,这使得对软件的分析能力和分析效率大大提高,给软件的安全性和版权问题带来了极大威胁。为应对逆向分析给软件带来的安全威胁,目前主要采取的保护措施有:一、加壳,使用强度比较高的虚拟壳或者通过
随着人工智能在人类自然语言中应用的越来越多,NLP(Natural Language Processing)在文本翻译、词性标注以及实体命名等领域中发挥着越来越重要作用。本论文的目的是在基于将计算机视觉中的图片信息和文本特征信息相融合的基础上对文本进行分类处理,主要研究工作由四个部分组成。针对多模态文本分类的词向量问题,设计了一种基于CBOW模型和Skip-Gram模型的SC词向量训练模型;分析已
命题可满足问题(propositional satisfiability problem,SAT)是人工智能领域的研究热点,也是数理逻辑及计算机研究中的核心问题,对人工智能发展起到了非常重要的推动作用。命题可满足问题擅长将一些艰难的故障求解转化为问题系统中命题公式是否存在可满足赋值的问题,并给出故障识别。极小不可满足集(minimal unsatisfiable subset,MUS)问题是命题可
财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务的需要,在一定时期内筹集的一切资金的总和。财政收入作为衡量一国政府财力的重要指标,是实现国家职能的财力保证。其中,地方财政收入作为我国地方政府部门的公共收入,在地方经济建设和事业发展的过程中发挥着重要的作用。地方政府在社会经济活动中,能够提供公共物品和服务的范围和数量,在很大程度上取决于地方财政收入的充裕程度。因此,对影响我国地方财政
社会的发展,科学技术的进步,向人们的思惟提出了新的、更高的要求,即要求思惟具有创造性。所谓创造性思惟,也是一种思惟活动,它是反映事物的本质规律的。但它是思惟活动的高
会议
财政失衡的效应具有复杂性,正如财政分权理论所指出,适度财政失衡的存在是合理且必要的,但过度的财政失衡将危害地方政府的财政行为,故而充分探索与研究财政失衡影响地方政府
随着互联网在人们的生活中应用的越来越广泛,网络安全也变得愈加重要。安全协议作为信息安全的重要组成部分,对其进行分析具有重要的研究价值。目前分析安全协议的方法多种多
创新既是一个民族不断进步的灵魂,也是企业向前发展的源源动力。企业集团作为一种重要的组织形式已经随处可见,近年来,国家政策和经济形势的推动下,我国已经建成一大批具有高质量、强竞争力的大型企业集团。在此背景下,本文探索了企业集团对企业专利创新的影响及其影响路径,得出了企业集团可以促进成员企业的专利创新的结论。本文的研究结论一方面拓宽了企业创新产出的研究视角,另一方面为企业提高创新产出水平提供了新的思路
云计算产业在全球范围飞速发展,吸引越来越多的企业及个人用户将其业务转移到云市场。在云计算中,云用户的需求有不同特性,部分用户对资源需求迫切,也存在用户对价格较为敏感
关联交易是一种常见的交易形式,在优化资源配置、节约交易成本和简化交易流程等方面,关联交易能够发挥其固有的优势,以便于更好地促进交易继续进行。但随着经济的飞速发展,关联交易的缺陷逐渐超越了其自身的优势,并且在关联交易中,双方主体之间地位上的不平等,就更加剧了关联交易在利益分配上的不均衡性。关联交易一开始的目的是通过减少公司经营中不必要的环节,减少成本,分散风险,获得利润最大化。而不公平的关联交易,会