意见领袖识别中的文本倾向性研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lwolffcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网对社会生活的影响越来越大,人们逐渐习惯于利用新兴媒体,如微博客、QQ、MSN、聊天室和论坛等平台交流心得体会、参与公众话题讨论。意见领袖作为社会舆论中的一种关键力量,在舆论形成的过程中具有非常重要的作用。局部意见在意见领袖的引导下演化为舆论,影响力直接渗透到现实社会。   目前国内外学者对网络意见领袖的识别方法进行了广泛的研究。而目前研究方法存在以下不足:一方面,有的方法并没有考虑回复帖子倾向性,用户统计信息等因素对意见领袖识别的影响;另一方面,即使考虑了这些因素,但并没有给出具体的研究计算方法。本文利用现有方法的优点,并根据具体的情况,给出了一种意见领袖识别中的文本倾向性判定方法,进而建立考虑回复帖子倾向性和用户统计信息的意见领袖发现模型,本文的主要工作有:   1.根据意见领袖识别中文本倾向性分析与常规的文本倾向性分析的差异,给出了意见领袖识别中文本倾向性判定训练集构造方法,叙述了帖子倾向性判定的具体方法。   2.在影响力扩散概率模型(IDPM)的基础上,叙述了考虑帖子倾向性的意见领袖发现模型,并阐明了考虑帖子倾向性有效系数的具体算法和意见领袖得分的具体算法。   3.针对评论性语料重复度高和倾向性较强等特点,给出了文档频率和倾向性加权结合的特征选择公式,加强了所选特征项的表述能力。   4.引入了用户统计信息,如回复帖数,用户支持度等对意见领袖识别的影响,阐明了考虑用户统计信息有效因子的具体算法。综合考虑倾向性和用户统计信息对意见领袖识别的影响。   通过实验对比可知:本文的方法能够有效提高意见领袖识别的正确率。  
其他文献
版权认证是一种对载体进行认证版权归属的行为,要求载体经过一定程度的正常修改能识别出其作者,而经过恶意篡改后的载体能检测出不同于原载体的版权归属。目前最常使用的版权认
无线传感器网络(WirelessSensorNetwork,WSN)是由大量具有感知、信息采集、数据处理以及无线通信等功能的传感器节点组成的自组织分布式网络。近年来,无线传感器网络的应用越来
信息推送服务是指根据用户对信息的需求,有针对性和目的性地将信息主动送达用户。通常采用客户-服务器机制,由服务器主动将信息推送给客户端。在消息推送服务过程中,无需客户机
目前,云计算作为一种新兴的计算模式,正被全世界人们广泛关注。云计算以其增强的计算能力,无限的存储容量,对用户端设备要求低以及高扩展性、高性价比和高度灵活性等优势,相比于传
短时交通流量预测是智能交通系统研究的关键。能否对短时交通流量进行实时的、准确的预测对实现交通控制和诱导起到了至关重要的作用。因此,对短时交通流量的预测研究具有十分
视觉认知是人类获取信息的重要方式,在视觉认知过程中,客观世界都以图像形式存在。图像分割作为视觉认知的基础,其目的是:从大量复杂的背景中,提取所需信息。但是,由于图像信息的
视频运动目标跟踪,这个课题作为机器视觉研究的一个主要分支,它就是对视场内的非静止的目标,如人和车辆等,进行实时的观测,并在这个基础上对把被观测对象按一定方法进行分类,然后仔
随着计算机网络的普及和信息技术的不断发展,网络在人们生活中的作用越来越大,网络中的文本信息也不断积累,种类复杂多样,文本分类系统的完善显得尤为重要。需要进行分类的文本往
无线传感器网络是由部署在监测区域内大量传感器节点以自组织和多跳的方式构成的传感器网络,具有大规模、低功耗、低成本和自组织等典型的特点,能够广泛应用于环境监测等多个领
近年来,实时系统被广泛地应用到安全关键的汽车电子领域。除保证实时应用输出结果的逻辑正确性外,还必须具有严格的时间确定性和高度的可靠性,否则会导致严重后果。然而随着应用