论文部分内容阅读
随着在线社交媒体的快速发展,在线社会网络的研究成为了当前数据科学的一个重要研究方向。复杂网络可以看作是这些真实网络的一种抽象,而发现这些复杂网络的社区结构是理解这些复杂网络结构和功能的重要途径。但是,经典的社区发现算法基本是基于单一关系的网络,而真实的网络绝大多数都是多关系的。由于在多关系网络中,每种关系所反应的只是片面的信息,因此,要深刻理解复杂的社会网络就需要全面地、综合地去分析所有关系。这样的多关系网络可以纯天然地表示成一个三阶张量的形式,而张量分解方法又可以从张量中学习到隐含的模式,因此,本文采用基于张量方法去分析多关系网络。 本文提出了一种简单高效的隐因子先验法则-隐因子余弦相似度先验去提升社区发现算法在多关系网络中的性能。这个先验法则是基于良好定义的虚拟多关系社会网络的大量观测统计:同一社区的成员所对应的隐因子间具有很高的余弦相似度。将这一先验知识融入到RESCAL张量分解模型中,可以使我们得到更加合理的隐因子,而这些隐因子将作为聚类算法的输入,从而发现不同的社区结构。为了简化模型及移除余弦相似度的限制,本文提出了一种RESCAL分解模型的变体N-RESCAL分解模型,并给出了求解此模型的高效迭代算法N-RESCAL-ALS。此外,由于闭环三角关系能够提升社区发现算法的性能,本文提出了一种同时对普通关系与闭环三角关系进行建模的方式。在本文中,我们所使用的聚类算法为凝聚层次聚类算法,而这样社区发现算法的架构我们称之为TNRA。我们在构造数据集和真实数据集下的实验都取得了非常好的效果,这充分说明了我们所提出的隐因子余弦相似度先验法则及TNRA算法架构的有效性。