基于Nutch的民航领域舆情信息监测技术研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:heinblue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的高速发展带来一系列网络监管上的问题,除传统的网络安全技术问题外,网络内容安全也越来越引起了人们的重视,网络舆情信息的监测正是在这种背景下产生的。舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度,而网络舆情则是人们通过网络表达自己对于社会事件的看法。研究网络舆情对于政府和企业了解民众的真实社会观点,及时做出正确决策,缓解社会矛盾有着重要的现实意义和实际价值。本文以Nutch为基本研究工具,面向民航特定领域,围绕舆情信息监测系统中的若干关键性技术,进行了比较深入的研究与探索。研究和构建了民航领域网络舆情信息监测系统架构,梳理和凝练了民航领域网络舆情信息监测系统中的关键技术。针对网络舆情监测中的中文信息处理,提出了一种适用于真实网络环境下的基于免疫遗传算法的网络新词识别方法。围绕热点发现,以Nutch为基本的网页采集工具,利用民航业专业词库和single-pass算法,提出了一种面向民航领域的网络热点发现方法。围绕舆情分析,以知网为基本的语义词典,提出了一种对热点事件相关网页上的评论进行倾向性分析的方法。并分别对上述方法进行了实验,结果表明提出的算法能够较好的解决网络环境下新词识别、热点发现以及评论倾向性分析等问题,为民航领域舆情信息监测系统研制提供了理论支持和技术支撑。
其他文献
两轮自平衡电动车是一种新能源、小型化、智能化的个人交通工具,同时也是一个多变量、强耦合、高阶的、非线性的一个倒立摆控制系统,为研制高性能、低成本的两轮自平衡电动车
在信息社会里,计算机网络已经成为日常生活最重要和最频繁的通信媒介,人们可以从其中获得大量的信息资源和服务;另一方面,计算机网络中充斥着信息安全隐患,有关网络安全受到
网络作为获取信息的主要路径之一,人们对它的依赖程度也在与日剧增。然而,网络中存在的越来越多的入侵行为,给人们的日常生活带来了困扰,甚至会造成巨大的经济损失、威胁到国
本文主要针对图像分割问题进行研究,通过广泛的算法对比,选择使用人工鱼群算法(Artificial Fish Swarm Algorithm,AFSA)完成图像边缘检测,结合模糊C均值聚类算法完成图像分割
图像恢复技术在航空航天、物理材料、人工智能、控制理论和人们娱乐生活等诸多领域有着广泛而深刻的应用。在数字图像的拍摄过程中,由于成像系统的精密性,传输媒介的畅通性,
随着计算机应用的深入和软件工程的发展,软件系统与其它系统一样,其自身也会逐渐老化,不再适应用户和环境的需要而变成遗产系统(legacy system)。软件演化已经成为了软件生命