基于用户特征分析的微博意见领袖挖掘研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:awangya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的广泛使用,论坛、微博等多种网络应用作为一种在线交流方式深入到人们日常生活当中,这些网络交流媒介会使得信息在几小时甚至几分钟内得到广泛的传播,如果不对这种瞬间传播进行有效地控制,一旦爆发了对社会或经济有影响的新闻或言论,就会覆水难收。因此在消息得到极大传播之前就要加以制约和控制,那么在网络中占据信息流动的主导地位、并且极具权威性的意见领袖的发现和监控就显得十分重要了。  目前对于意见领袖的挖掘方法主要有统计学方法、聚类分析法、网络结构分析法等。其中聚类算法着重考虑用户重要度、活跃度等用户自身属性,网络结构分析法多偏向于考虑用户之间的关系,这两种方法都能达到比单纯统计的方法更加有效的挖掘效果,但两者都相对独立,考虑因素不全面,导致挖掘结果有偏差。  本文针对后两种挖掘方法,结合用户的属性和用户间的关联性,并对现有方法进行了改进,还对意见领袖做了其他扩展性研究比如主题相关性与情感分析等。本文阐述了当前微博意见领袖的概念及国内外研究的现状,理论上分析了用户属性和用户关系两者的侧重点,综合现有方法并结合IKCCSA算法在意见领袖挖掘上的优点,提出了一种新的概念和挖掘方法——用户特征分析方法,并且在腾讯微博数据集上进行了验证,发现本文的方法更加准确有效。本文主要的研究成果总结如下:  ①本文充分考虑了用户的自身属性和用户的关联性,提出了基于用户特征分析的微博意见领袖挖掘方法,并且对算法做了对比实验和相关验证性实验。  ②针对属性的聚类,K-means系列算法初始簇难以确定的问题,借鉴IKCCSA算法,提出了改进算法D-means,通过对密度的排序和梯度点概念的描述,得到更准确的初始簇中心,并且在微博挖掘实验中验证了它的合理性。  ③在基于用户关系挖掘中,考虑了小世界网路中节点距离和聚集系数的关系,提出用户中心权威性Centrality概念,一定程度上避免了虚假意见领袖的出现。  ④为了挖掘到更加细化的意见领袖,本文验证了意见领袖的主题相关性,并且通过对用户评论和转发进行情感分析,初步得到了意见领袖的分类:正面型、负面型、中立型和争议型。
其他文献
无线传感器网络作为物联网的特殊子集,被广泛的应用于目标监测,特别是对敏感对象的监测。在无线传感器网络中,我们称感知到目标对象的节点为源节点,由于应用的特殊性,源节点
绝缘故障是变压器的主要故障类型之一,而局部放电的监测或检测则能够反映变压器的绝缘状态。研究变压器局部放电信号,对其进行放电模式识别的判别分析,对于及时发现变压器的潜在故障、防止变压器的故障发展和电力系统安全运行有着重要的意义。首先,本文依据局部放电产生的原理、特点,根据变压器常见的四种局部放电模式,搭建了变压器局部放电的实验系统,包括测量系统、传输系统和实验系统的原理图和接线图,在此基础上讨论了现
以互联网技术为核心驱动的信息化发展和全球经济一体化的不断深入,促进了金融服务信息化的发展。随着用户数量的不断增大和需求的不断更新,金融服务行业需要建立一种可以降低
无线传感器网络是一种感知网络,由大量规模小,成本低和能力有限的传感器节点组成。这些节点收集局部环境中的信息数据,以无线方式通过单跳或多跳将这些数据传送给基站,由基站对数
随着无线通信技术的快速发展,无线传感器网络以其组网迅速、成本低、灵活性高、网络动态性强等特点,在众多领域有着广阔的应用前景。但由于传感器节点的计算及存储能力有限、
节能和环保是能源领域中研究的重要科学问题,随着新能源的开发和对绿色能源的渴求,并综合考虑能源利用率与环境因素的影响,在配电侧接入小型的分布式能源已成为智能配电网发展的
不经意传输(OT)允许通信双方以不经意的方式传送消息,最终使接收方获得发送方的某些消息并保护接收方的隐私不被发送方获取。在密码学中,不经意传输协议是一个非常重要的基本原
二维码作为一种新的信息存储和传递技术,具有可靠性高、信息容量大、保密防伪性强等优点,已经被广泛的应用到生活中各个领域,极大的推动了经济的发展。随着智能手机的普及、
随着计算机技术和网络技术的飞速发展,数字图像在网络中的传输已经变得越来越普遍。正因为如此,数字图像信息的安全和保密问题日益成为了人们关注的焦点。由于图像自身的数据量
随着智能手机的大众化,移动应用层出不穷,要在众多的应用中得到用户的青睐,除了功能实用外,该应用的用户体验势必也是绝佳。按照传统的开发方式,应用需要频繁更新,而每更新一