网络舆情热点检测与跟踪技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:panzhengdang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络舆情热点检测与跟踪技术主要利用计算机对海量的网络信息进行处理,提取热点主题并且对热点主题进行跟踪,它能把握整个舆情的动向,并且能够为下一步的舆情处置行动提供参考,是网络舆情分析的关键技术。本文主要针对BBS论坛,对网络舆情热点检测与跟踪技术进行了研究,提出了新的网络舆情热点检测与跟踪方法,并获得了满意的实验结果。  首先,本文对网络舆情热点检测与跟踪技术的现状和发展进行了简要的回顾。文中分别对网络舆情信息挖掘的相关技术和热点检测与跟踪算法作了分析。网络舆情信息挖掘主要包括网络舆情信息采集、网络舆情信息预处理、网络舆情信息分析等部分,并且介绍了现有的国内外网络舆情系统,对网络舆情热点检测与跟踪技术的研究主要包括话题检测与跟踪任务和话题检测与跟踪的关键技术等。  其次,本文提出了基于共词分析的网络舆情热点检测方法。传统的共词分析方法一般运用在某一专业的学科领域中,通过判断学科领域中主题间的关系,进而展现该学科的研究结构。本文提出将共词分析运用到网络舆情热点检测方法中,而BBS是网络舆情的主要载体之一,该方法将共词矩阵和聚类方法相结合,从而在BBS环境下发现舆情热点主题。实验证明本文提出的算法在BBS环境下的应用具有稳定性和高效性,并具有一定的可信度。  再次,本文在总结了现有的主题关注度提取方法的基础上,分析了它的优缺点,并提出了一种基于关注度的热度提取方法,即综合考虑论坛帖子权重值和主题的媒体关注度对主题热度的影响。紧接着主要根据主题距离构建出主题进化图,将相对熵的概念引入到主题距离提取的方法上,并介绍了一些相对熵的应用。通过相对熵的阈值判断,从而发现各个时间戳中主题的延续性。  最后,分别使用大规模数据语料和真实论坛语料对本文提出的基于共词分析的网络舆情热点检测算法和基于热度分析的网络舆情热点跟踪算法进行了实验,并对测试结果进行了分析。实验结果表明,本文的算法对处理网络舆情热点检测与跟踪问题具有一定的可用性。  本文最后对论文所做的工作进行了总结与评述,并提炼了网络舆情热点检测与跟踪技术中值得继续研究的若干问题,为以后的研究指明了方向。
其他文献
Ad Hoc网络是由无线移动终端组成的多跳的临时自制系统,它不需要预先架设基础网络设施就能快速组网。由于Ad Hoc网络自身独特的特点,如何设计性能优良的路由协议已成为当今Ad
钓鱼网站是在网页中包含恶意欺骗信息,引诱互联网用户提交个人信息从而窃取其隐私信息乃至个人财产的一种网络攻击方式。为了提高钓鱼网站检测的准确性,减少对第三方工具及资
图像和视频去噪就是去除图像及视频在获取和传输等过程中带进的噪声,从而提升图像质量并方便后续的处理,因此图像和视频去噪是图像处理过程中一个非常重要的环节。本文的工作
近年来,虚拟化技术因为能提供良好的独立性、服务器整合以及易管理性而备受关注。作为虚拟化技术的一个重要特征,实时迁移能够完整、无缝地将一个虚拟机从一台物理服务器迁移
临床应用中,医学影像学的主要目的就是解释并获取高质量的医学图像,目前此类问题主要是通过计算机技术来实现的。本文主要是针对计算机技术在医学影像学的应用过程中遇到的问
随着网络信息技术飞速发展,信息在人们的生活中扮演着越来越重要的角色。各行业需要从海量数据中搜索有用信息来满足自身需要。但这样有可能导致个体隐私的泄露,随之而来的是
能源是人类生存、经济发展和社会进步不可缺少的重要物质资源,同时也是影响人类生存环境的重要因素。近年来能源价格逐步上升,能源在企业成本中的比重也相应增加,另外,随着人
近年来,短消息服务(SMS)已经成为人们相互沟通的重要通信工具,同时,随着移动电子商务的快速发展,它也成为从事移动电子商务的快捷、方便的基础服务设施。然而,短消息服务(SMS)本身
随着信息技术的高速发展,富客户端技术在Web应用中越来越广泛。Web作为推动电子商务发展的媒体,越来越多的企业通过它来改善业务运行模式,提高与客户的合作效率。另一方面,随
随着信息技术的发展,Web服务得到了广泛的应用。在使用Web服务时,用户不能总是保持匿名状态,往往需要向服务提供方提交一些隐私数据来完成业务功能。单一的Web服务已经不能满足