论文部分内容阅读
网络时代的到临,微博社交网络成为了网络舆论传播的主要载体。虚拟社交网络信息交流的便利性以及频繁性引发了众多学者的关注,特别是关于识别在更大程度上影响微博网络结构与功能的关键节点的议题成为复杂网络领域的研究热点。由于现有研究的单一同质网络模型无法表征真实网络情况,因此本文在对复杂网络研究现状以及理论基础分析总结的基础上,结合新浪微博的功能和传播特征,率先引入超网络模型对微博社交网络进行建模,从社交、信息、话题和传播意愿四个维度构建四层超网络模型。传统基于单一同质网络模型的关键节点识别方法不适用包含多层次属性的超网络模型,因此本文提出了基于微博超网络模型的子网节点量化方法,构建一种基于可扩展LDA模型的微博话题特征抽取方法对话题子网进行节点量化;利用中文情感本体对意愿子网的节点进行量化,将现有的网络结构特征的定量研究扩展为自动化建模的超网络研究。针对超网络环境下的关键节点识别问题,本文构建了基于信息传播影响度、话题语义相似度和情感一致性的超边排序算法(HyperEdgeRank)对超边进行计算,综合计算所有用户节点的超边与超度值进行节点排序,实现微博超网络中的关键节点的识别。最后本文利用真实新浪微博数据,分别就微博话题抽取方法以及关键节点识别方法进行实验验证。实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足;中文情感本体能够有效的对意愿子网进行量化;关键节点识别方法能够有效并准确的识别微博超网络中关键节点,具备较强的应用价值。