论文部分内容阅读
作为理解网络中观特征的关键概念,社区结构一直是社会网络研究的重要主题之一。随着社会网络研究的逐步深入,愈来愈多的研究者尝试从中观的角度对社会网络进行深入研究。尽管已经产生大量与网络社区分析相关的研究成果,包括理论、模型与算法等,这一宽广的领域仍存在大量尚未加以深入研究的课题,尤其是重叠社区结构建模与发现、社区演化机理与微观尺度上对异常网络个体的识别与分析。本文致力于系统研究上述问题,提出面向多模复杂网络的重叠社区建模与发现方法,并运用统计学与灰色系统理论研究网络社区的演化统计规律、演化趋势预测和演化离群点识别技术。 本文的主要工作及创新点包有: 1)针对多模网络上的社区发现问题,以微博社交平台为研究对象,通过深入分析和构建相应的实体间关系模型,创新性地提出首先以“用户-话题”关系弧为社区划分主体,并全面融合用户关注关系、话题相似关系、评论关系和转发关系构建“用户-话题”关系集合上任意“用户-话题”弧之间的相似性度量,从而将网络转化为以“用户-话题”弧为节点的加权图网络。进而利用图上的优势集聚类技术实现了“用户集-公共话题集”形式的重叠社区发现。实验说明这一方法能够真实反映微博网络实体间的复杂关系,对研究多模复杂网络重叠社区发现问题具有普遍意义。 2)针对传统网络重叠社区个体隶属关系矩阵不能合理体现现实网络中个体对网络参与度和核心度的缺陷,提出新的网络重叠社区全局隶属矩阵表示模型。该模型通过引入虚拟社区的概念,使全体节点参与现实社群的剩余值归入该虚拟社区,实现了全体成员对现实参与度和核心度的归一化表达,能够更加合理地描述现实网络个体的角色属性。 3)从统计学基本原理出发并利用稳健回归优化技术深入研究包含重叠社区的社会网络演化模式匹配问题,提出了用于度量网络个体演化模式匹配的定量描述工具—社区迁移矩阵,并证明了迁移矩阵的若干优良性质。为了降低离群个体对迁移矩阵拟合精度的影响,提出了基于稳健M-估计的迁移矩阵优化方法。稳健迁移矩阵不仅能够利用较小规模的迁移矩阵拟合大规模网络社区的主流演化趋势,同时还可以定量计算社区离群个体相对于社区主体的演化偏离。 4)为了进一步揭示网络社区中长期时间跨度上的演化规律,将传统的灰色系统模型推广到矩阵序列的情形,构建了基于迁移矩阵序列的社区演化估计模型,给出了相应的矩阵灰微分方程的解。该模型能够利用已知迁移矩阵序列实现对未来社区演化结果的预测,从而可以进一步揭示网络社区的演化规律,为相关控制与决策提供理论依据。 5)基于网络社区演化匹配与预测技术研究成果,充分考虑了社区演化的动态特性与社区角色特征,并对海量数据中“有意义的”离群点与无价值的大量噪声点加以区别,在重叠社区意义下、多维空间数据集非重叠类团意义下和迁移矩阵序列灰色估计模型意义下提出了的三种基于社区演化趋势的离群点检测方法。所提出的方法能够综合反映个体的社区核心度变化与演化态势差异,避免了离群点检测陷入对大量无意义噪声点的识别与解释。