网络舆情分析关键技术研究与实现

来源 :电子科技大学 | 被引量 : 24次 | 上传用户:xia96316
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和通信技术的飞速发展,互联网己成为了人们生活的不可缺少的组成部分。据国际电联统计,截止至2010年12月,全球互联网用户总数已经超过20亿。其中,我国的互联网用户数量已经超过3.9亿。网络被公认为是继报纸、广播、电视之后的“第四媒体”,民众知情权、表达权、参与权、监督权在互联网上已基本得到落实。网民对企业、民生、政府管理、反腐败、社会道德等热点问题在互联网上踊跃发表意见,这些意见形成一种强大的舆论压力,其影响已经大大超过了传统媒体。网络已经成为反映社会舆情的最主要载体。在网络舆情迅猛发展的同时,对网络舆情分析监控工作显得愈发重要。网络具有的开放性和相对自由的宽松度,使得民众发言摆脱了社会权利体制的管制和限制,可以畅所欲言无所顾忌的表达个人的观点、立场、情绪,民意表达更为畅通。网络也由于其虚拟性也带来了很大的安全隐患,发言者身份隐蔽,并且缺少规则限制和有效监督,因此网络很容易成为一些网民发泄不良情绪的空间。而且由于目前我国正处于社会转型期,存在诸多矛盾,再加上少数社会管理者对于舆论习惯性的回避或堵塞,因此,非常需要使用舆情分析系统对网络舆情进行分析监控,及时防范误导性舆论造成的社会危害,把握和保障正确舆论的前进导向,为构建和谐社会的舆情保驾护航。本论文对网络舆情分析系统进行需求分析,提出了系统的设计方案,并实现了系统中网页文本分类和文本倾向性分析等关键技术。本论文的先进性表现在:1)针对现有的通用爬虫技术存在的局限性,提出了一种基于爬行策略和过滤策略的数据采集方法,过滤大量无用信息;同时制定了针对舆情分析系统的网页库更新策略,保证本地网页库的时新性。2)通过对基于朴素贝叶斯的网页文本分类技术进行研究,提出了一种基于粗糙集改进的朴素贝叶斯分类方法,并将该方法运用到舆情分析系统的舆情分类中。3)通过对现有的基于语义和基于机器学习的文本倾向性分析技术分别进行了探讨,并结合两类方法的优点,提出了一种基于语义改进的机器学习文本倾向性分析方法,并将该方法成功的应用到舆情分析系统中。
其他文献
《惠特曼组诗》是英国作曲家奥利维尔·纳森(Oliver Knussen)在1991-1992年间以美国诗人惠特曼的四首诗作为背景创作的女高音与乐队的管弦乐作品。作品在结构布局、织体形态
新加坡公共交通体系建设的成功经验,对于珠三角一体化实施过程中公共交通体系的建设有着极大的参考价值。以之为借鉴,我们可以从树立公交发展导向、道路供需管理、人性化换乘体
温室西红柿叶面施肥要针对不同情况采用不同的管理方式,具体应注意以下几点: 1.根据生长情况确定营养种类。结果前期,植株生长比较旺盛,易促长,可选用磷酸二氢钾、复合肥等
死生,人生大事也,人一出生,注定走向死亡。死亡的不可抗拒性使它成为文学永恒的主题。中国是诗的国度,诗人在意识到自身生命即将结束之际,心中必有无限感慨,发言为诗,便是中
目的观察中医推拿联合自拟四君子汤直肠滴注治疗小儿β-内酰胺类抗菌药物相关性腹泻的疗效及对肠道菌群和免疫功能的影响。方法将94例β-内酰胺类抗菌药物相关性腹泻患儿随机
媒体融合时代到底应该以技术为王,还是以服务、渠道等其他要素'为王'?随着技术、渠道资源的普及应用,相关资源的竞争力逐渐下降,内容的决定性竞争力又重新凸显了出来
随着我国全面依法治国战略的推进和法治体系的逐步完善,人民法院受理的进入执行程序的民事案件越来越多。在国家权力的实施体系中,法院执行占有重要的地位。在实际的法院执行过程中,会出现一些侵犯执行人、被执行人、案外人及其他公民或组织的合法权益的情况,进而引起相应的国家赔偿责任。在我国的《国家赔偿法》中有相关规定专门针对法院民事执行过程中引起的国家赔偿责任。这些规定,其目的在于尽量减少已经造成的损失或者纠正
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技