质检总局舆情监控系统中信息抽取的研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:yulu0355
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对质检总局舆情监控系统中的信息抽取进行了设计和实现。质检总局舆情监控系统能够满足用户对舆情信息进行全面监控的需求,为用户提供智能化、个性化、多样化的舆情监控服务。论文完成的主要工作如下:(1)完成了互联网舆情信息监控系统的需求分析和总体设计,包括信息抽取层、用户层、数据库层和系统管理层。信息抽取层负责处理网页信息;用户层为用户提供各项系统服务;数据库层为存储和维护系统服务所需的数据;系统管理层负责关键词管理和网站管理。(2)采用网页信息预处理和网页解析技术,实现了网页的信息抽取。利用HtmlParser工具和正则表达式技术,去除了网页中的冗余信息。利用正文提取算法对网页文件进行解析,从中提取出网页的标题、摘要和内容。根据网页析取出的内容以及存储在数据库中的数据提取出网页关键词和网址URL。利用JSP、Javascript和Ajax等技术实现了系统管理模块。(3)设计了系统测试用例,完成了对系统的测试。测试结果表明,系统基本满足了用户的需求,具有良好的稳定性和实用性。论文对舆情监控系统中的信息抽取和系统管理进行了研究,实现了网页的正文、摘要、关键词和网址的抽取以及系统管理,可为用户提供信息抽取服务,研究成果具有一定的理论意义和应用价值。
其他文献
近年来,通信技术的发展日新月异。随着3GPP组织LTE标准制定工作的收尾,焦点进一步转移到LTE-Advanced (LTE的演进版本)。演进的目标是达到甚至超越IMT-Advanced在带宽、平均
随着软件的规模在不断的增大,软件复杂度的不断提高,软件的结构也已经出现了多层次、多粒度、多集成方式的组织方法,若仅仅研究单一层次的软件网络并不能完整的体现软件的整
作为当前网络研究的热点,网格是构筑在Internet上的一组新兴技术,它通过高速互联网将分布在世界各地的种类繁多的资源无缝地集成起来,实现对计算资源、存储资源、信息资源、
随着我国经济的发展,常规能源的资源紧缺、使用化石能源引发环境污染等问题已日益突出。为了实现可持续发展,国家鼓励积极发展可再生能源。在国家产业政策支持以及技术进步的背景下,风能发电的装机容量必将持续增长,制造成本则将逐步下降。风能将会在国民经济和民众生活中成为一种重要的可再生能源。然而,风电和其他能源相比存在诸多不利因素,例如理想风轮的换能效率极限值不可能超过59 .3%;自然条件下风的变化频繁有时
随着对MANET (Mobile Ad-hoc NETwork,移动Ad hoc网络)的不断研究,MANET的应用也得到不断发展。几乎可以涉及到所有方面。例如移动会议、家庭应用、紧急服务、传感器网络、个
微架构模拟器已经成为微架构研究中不可或缺的工具,被广泛地应用于功能验证、性能评估、设计空间探索等领域,使用软件模拟硬件的方式能够以更快的速度,更低的成本对各种设计方案
进入21世纪以来,在全球经济一体化和日益发达的信息技术的双重推动下,越来越多的商业交易正在努力实现网络电子化。许多发达国家和地区纷纷开发构建电子招投标系统,对保证其招投
本文介绍了OSGi与持续集成在ILTP的应用。ILTP是基于SaaS模式开发的智能测井工具平台。它能根据用户的需求动态组合模块,提供给用户使用;同时能7×24小时不停运转。这样,对系统
随着计算机图形学的发展,人们用越来越多的方式来模拟自然场景。在一些应用领域,如网络视频聊天,人们往往希望通过图形图像来表达真实感绘制的图形之外的信息,比如图像中人物
随着通信技术、嵌入式计算技术和传感器技术的不断发展,无线传感器网络的使用变得很广泛,节点定位作为无线传感器网络的主要技术之一,节点的位置信息对于用户检测到事件后应