论文部分内容阅读
随着计算机互联网技术的迅猛发展,诸如新浪微博、人人网、Facebook以及Twitter等新型的社会网络产品不断涌现。借助移动通信网,社会网络服务具备了及时性和动态性,满足了人们随时随地分享交流的需求。但是,社会网络在给人们带来灵活方便的同时,也存在许多安全隐患与舆论传导等问题。对社会网络社区发现与影响力分析技术的研究有助于更加深刻地认识网络的本质特征,了解其内部真实结构,为信息层和行为层的网络安全与防范提供决策支持。目前针对这两方面的研究主要存在着以下不足:(1)静态社区划分中通常基于拓扑结构特性,欠缺对社会网络属性特征的考虑;(2)单单对静态网络的研究已不足以刻画真实网络的动态性以及内部本质结构;(3)现有的社会网络影响力算法及模型的较高时间复杂度已不适用于网络规模不断壮大的社会网络服务。针对以上问题,本课题依托国家“十二五”863计划项目,主要对社会网络社区发现算法进行研究。首先提出了基于静态网络的联合网络拓扑与属性的社区发现算法,并基于此依据网络拓扑随着时间的变化量研究动态社区的发现与识别,最后在良好的社区结构基础上分析社会网络影响力传播问题,建立了一种基于社区结构的用户影响力评估模型。主要工作和研究成果如下:1.提出一种基于模糊等价关系的联合拓扑与属性的社区发现算法。联合拓扑与属性定义了完全相异距离指数的概念来衡量节点间的综合距离,并以此作为隶属关系建立模糊等价关系矩阵,依据选定的聚类阈值不同得到相应不同的社区结构,形成一个动态层次聚类的过程。实验结果表明该算法能更有效地识别出密集网络的社区结构,发现结果质量较好,且相同社区内的节点具有同质性。2.提出一种基于加权网络的增量式动态社区发现算法。在静态网络社区结构基础上,依据当前时刻网络相对于前一时刻的改变量采用基于增量式的方法更新原有社区结构。动态节点的归属通过定义的节点与社区之间的拓扑势吸引来评判,即选择对其势吸引大的社区加入。实验结果表明本算法能够以较低的时间复杂度发现质量较好的社区结构。3.建立了一种基于社区结构的用户影响力评估模型。针对现有方法复杂度较大的问题,首先评估各个社区中节点的影响力,挖掘其核心节点成员;继而在核心节点集和连接社区间的弱纽带节点中选取若干具有影响潜力的初始节点,使其以最小的代价让信息在网络中得到最广泛的传播。实验结果表明该模型不仅降低了时间复杂度,还获得了接近贪心算法的影响范围。