基于张量分解的多关系网络社区发现算法研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:sunjf2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线社交媒体的快速发展,在线社会网络的研究成为了当前数据科学的一个重要研究方向。复杂网络可以看作是这些真实网络的一种抽象,而发现这些复杂网络的社区结构是理解这些复杂网络结构和功能的重要途径。但是,经典的社区发现算法基本是基于单一关系的网络,而真实的网络绝大多数都是多关系的。由于在多关系网络中,每种关系所反应的只是片面的信息,因此,要深刻理解复杂的社会网络就需要全面地、综合地去分析所有关系。这样的多关系网络可以纯天然地表示成一个三阶张量的形式,而张量分解方法又可以从张量中学习到隐含的模式,因此,本文采用基于张量方法去分析多关系网络。  本文提出了一种简单高效的隐因子先验法则-隐因子余弦相似度先验去提升社区发现算法在多关系网络中的性能。这个先验法则是基于良好定义的虚拟多关系社会网络的大量观测统计:同一社区的成员所对应的隐因子间具有很高的余弦相似度。将这一先验知识融入到RESCAL张量分解模型中,可以使我们得到更加合理的隐因子,而这些隐因子将作为聚类算法的输入,从而发现不同的社区结构。为了简化模型及移除余弦相似度的限制,本文提出了一种RESCAL分解模型的变体N-RESCAL分解模型,并给出了求解此模型的高效迭代算法N-RESCAL-ALS。此外,由于闭环三角关系能够提升社区发现算法的性能,本文提出了一种同时对普通关系与闭环三角关系进行建模的方式。在本文中,我们所使用的聚类算法为凝聚层次聚类算法,而这样社区发现算法的架构我们称之为TNRA。我们在构造数据集和真实数据集下的实验都取得了非常好的效果,这充分说明了我们所提出的隐因子余弦相似度先验法则及TNRA算法架构的有效性。
其他文献
计算机辅助几何设计中,曲线、曲面有两种基本的表示方法:参数形式和隐式形式。在实际应用中这两种表示方法有着各自的优缺点。参数曲线曲面具有构造简单直观、易于显示等特点,又
当今世界计算机和互联网技术的不断发展和带宽的快速增加,P2P的文件共享占据了网络绝大部分流量,成为互联网文件分发的主要模式之一。P2P文件共享就是P2P技术技术发展的动力源
近年来,一门新兴学科——数据挖掘,引起了人们的广泛关注,被应用到模式识别、统计学、数据库等众多领域。社会网络作为其中一个应用方向迅速发展,并且成为一个研究热点。对于社会
Reed-Solomon码是一种在移动通信,深空通信,数字存储中广泛应用的非二进制的循环纠错码。它具有严格的代数结构,对随机错误,突发错误和删除错误都有良好的纠错性能。本文主要研究
随着网络通信技术的发展及社交工具的普及,QQ、微信等即时通信工具得到了广泛应用,产生了大量的用于交互的短文本。这些交互式的短文本中包含了丰富的信息资源,具有很高研究价值
对等网络作为区别于传统C/S集中模式的全新共享方式,因其全网节点的参与互动性和平等性赢得了越来越多研究人员的青睐。对等网络按照结构类型可分为结构化和非结构化两种模式,
越来越多的软件系统部署在动态、开放和不可预测的环境中,为了提高系统的灵活性和健壮性,人们希望软件实体能够感知外部环境的变化,并根据环境变化和内部状态不断调整自身的
随着互联网的迅速发展和普及,因特网和计算机网络面临越来越多的安全威胁。网络攻击的直接表现是网络流量异常,这就要求必须快速有效的检测出异常。为了保护目标系统和网络免受
随着嵌入式技术、信息技术和网络技术的快速发展,信息世界和物理世界紧密的联系在一起,在这种的背景下CPS应运而生。CPS是物联网的智能化扩展,也是下一代网络化机电一体化控制系
随着移动互联网的迅速发展和移动终端的普及,微信成为人们学习生活中不可或缺的社交软件。移动端的文章推荐软件不断涌现,推荐效果不尽相同。在文章推荐领域,协同过滤推荐算法与