社会媒体群组探测的谱聚类研究与应用

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:huangjh9246
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我们真实的世界里存在着大量的复杂网络。节点代表研究对象,节点间存在着各式各样的联系即边。以微博、Twitter为代表的社会媒体平台中的社会网络就是真实社会中复杂网络结构的一种。社会网络拥有复杂网络的各种共性特征,包括小世界效应、无标度特性、群组结构等等。本论文将要研究的对象主要就是网络中的群组结构。网络中的群组结构即将其中的节点划分为多个群组。假如节点属于相同群组的话,则它们间的关联就比较紧密。假如节点属于不同的群组的话,则它们间的关联就比较稀疏。有关群组探测方面的相关问题及算法研究有着重要的理论研究意义和实际的应用前景,近些年来受到各个领域的研究人员的广泛关注。社会媒体近年的大量涌现使得社会网络的规模越来越庞大,网络中的关系也变的日趋复杂,给群组探测算法带来挑战。群组探测方面的算法比较经典的有Fast-Newman算法、GN算法、Kernighan-Lin算法、LFK算法、CPM算法等等,本文主要对谱聚类算法在群组探测的应用等方面进行了相关研究。本文做的具体工作如下:1)由于传统NJW谱聚类会受到尺度参数的影响。所以针对这个问题本文在谱聚类算法的研究基础上,对其引入基于引力的相似性度量方法并结合Floyd-Warshall算法。从而消除了尺度参数的影响,并且也达到了比较好的聚类效果。2)谱聚类一般通过K-means算法对特征向量完成聚类操作,所以对初始聚类中心的选择比较敏感。针对这个问题,本文提出一个新的初始中心选择方法进而提高了谱聚类算法的稳定性。3)本文将上面提出基于引力度量与初始中心优化的谱聚类算法(简称GMIK-SC算法)运用到非重叠群组探测中。在三个真实的网络数据集上比较研究,进而测试群组划分效果。4)本文将基于引力的度量方法与基于FCM的谱聚类结合,提出基于引力度量与FCM的谱聚类算法(简称GMF-SC算法),并将其运用到重叠群组探测中。在两个真实网络上比较研究,并测试了GMF-SC算法的群组划分效果。5)针对社会媒体中的新浪微博,本文基于改进群组探测算法设计了面向微博用户的群组探测方法框架,对本文的成果做了进一步的验证。
其他文献
难熔矿物成分复杂,反应所需温度较高。在对其进行常规BrF5法氧同位素组成分析中发现,存在样品用量大,影响因素多,污染反应器、安全性低等不利因素。目前,氧同位素组成分析向
随着工业时代到来,人类对能源的需求也越来越大。煤炭、石油、天然气等化石能源在消耗的过程中释放出大量污染气体,使得地球环境污染加剧。我国人口众多,人均能源供应水平低,
地震孕育、发生的过程极其复杂,大量研究表明,在地震事件发生前后通常伴随着多个物理量的异常变化。大量研究结果表明,在这些物理量中,大地电磁信号对地震事件的反映较为敏感
有机-无机杂化半导体材料是一种新型的复合功能材料,它结合了有机半导体材料结构多样性和无机半导体材料高载流子迁移率的优点,在光电、传感器、光学、照明、能量转移等领域
GH4169合金是一种沉淀硬化型镍基变形高温合金,广泛应用于航空、航海、化工等重要领域。随着GH4169合金应用领域的不断拓展,对合金的高温力学性能、耐腐蚀性能等综合性能要求
随着信息技术的高速发展,微波介质陶瓷凭借高介电常数、高品质因数和近零的谐振频率温度系数等优点,被广泛的应用于微波传输、电子对抗等领域。科学技术发展对电子元器件集成
中国是世界上最大的蔬菜生产国和消费国。在经济领域当中,蔬菜是竞争比较充分的产业。大城市的蔬菜产业是一项重要的经济产业,大城市蔬菜生产的经济效益明显高于农村地区粮食
煤矿瓦斯爆炸事故是煤矿重大灾害之一,瓦斯爆炸事故会造成大量的人员伤亡和生产系统破坏。合理的阻隔爆技术及装备,能够有效地减弱瓦斯爆炸事故的能量,降低破坏能力,减小波及
在社会的发展进程中,推动社会进步、民众富裕、国家富强的重要力量是人才,当代国家之间竞争也由原来以经济、军事为主的竞争演变成人才为主的竞争。在企业之间的相互竞争中,已经
氧化锌(ZnO)是一种宽禁带半导体,具有机电耦合性能良好、激子束缚能高等特点,而且ZnO原料易得,成本低且无毒。这些优异性能使其在气敏和压敏原件、压电器件、太阳能电池、薄