论文部分内容阅读
Facebook、Twitter、微信和微博等新型在线社交媒体,作为连接现实世界和虚拟空间的纽带,汇聚了大量的关系、行为等可感知和可计算的人类社会的数字足迹。随着网络规模的不断扩大,社会网络分析已成为当前研究的热点之一,受到广大学者的关注。其中,顶点间相似性度量方法作为研究各类社会网络的基础,对链接预测、社区发现、社区演化和影响最大化等问题的研究具有重要的理论意义和应用价值。本论文引入集对分析理论,将社会网络刻画为一个同异反(确定与不确定)系统,提出新的顶点间相似性度量方法,并基于该相似性指标进行社会网络分析的相关研究。具体研究内容如下。 首先,在传统社会网络中,针对基于集对理论的相似性度量指标中仅考虑了网络中共同邻居数量、忽略了拓扑结构等问题,提出一种新的顶点间相似性度量指标WCCD(Weighted Clustering-Coefficient Connection Degree)。该指标采用集对联系度重新刻画顶点间的同异反属性,并基于顶点度和网络拓扑结构为同异反属性进行加权,从而描述顶点间的相似性。为了验证WCCD指标的合理性和正确性,给出相关定理和链接预测算法。同时,提出基于WCCD指标的社区发现算法。该算法可以减少凝聚型层次聚类算法中频繁的更新操作,避免顶点聚合中的不合理现象。 其次,在符号网络中,针对顶点间相似性度量指标中存在的全局性指标具有较高的复杂度、局部性指标低估了顶点间的相似性等问题,提出一种新的顶点间相似性度量指标SNCD(Connection Degree Between Vertices in Signed Networks)。该指标将符号网络中的确定性和不确定性关系,与网络局部和全局拓扑结构相融合,提高顶点间相似性的精确度。为了兼顾正边和负边预测的准确率,将聚集系数和结构平衡理论相结合,提出符号网络链接预测算法。同时,提出基于该预测模型的符号网络动态社区挖掘算法,可以提高社区划分的准确性和稳定性,从而实现采用集对理论分析符号网络社区演化规律。 最后,在主题关注网络中,针对该网络同时具有用户和主题两类实体的特性,提出一种新的顶点间相似性度量指标TANCD(Connection Degree Between Vertices in Topic Attention Networks)。该指标侧重用户对主题的共同关注度刻画顶点间的同异反属性,突出主题在网络结构中的重要性。为了准确划分以主题为中心的社区,提出基于 TANCD指标的主题社区发现算法。为了进一步实现主题在网络中最大化的传播,提出主题偏好和用户影响力的定义,以及基于主题的影响最大化算法。并通过实验验证上述算法的正确性和有效性。