Web突发事件新闻文档的结构化表示方法研究

来源 :山西大学 | 被引量 : 2次 | 上传用户:harric1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展和因特网的普及,Web已经成为人们获取信息的一个重要途径,从网上获取各种各样的知识成为人们日常工作的重要组成部分。近些年来,人们尤为关注诸如煤矿爆炸、飞机坠毁、恐怖袭击等突发事件的发生,国家和各级地方政府有关部门迫切需要准确地、全面地掌握国内外各种突发事件的发生情况和发展趋势,为及时采取应急措施和指定防范规划、计划等提供科学决策依据。如何在这海量的信息中搜寻所需要的信息,获取信息的主旨,如何快速阅读每天涌现出来的新信息,已经是一个迫在眉睫的问题。如何查找和利用用户所需的各类信息成为学术界日益关注的焦点和迫切需要解决的问题。根据用户的兴趣和访问的模式,主动向用户推荐相关信息(个性化服务)已经成为热点。然而解决这些问题都需要首先研究所处理的资源。目前,个性化推荐系统所处理的资源大多属于文本范畴。所以有关文本处理的各种技术得到极大的促进和发展,他们为计算语言学的发展注入了新的活力,而这些领域与文本结构分析有着十分密切的关系,后者是前者的基础。本文研究的目的就是在深入分析突发事件新闻文档特点的基础上,给出一种基于概念的突发事件新闻的文档结构,该结构从语义方面对文本信息进行了分析,为以后研究个性化推荐技术提供一点依据。本文的主要工作如下:1.分析突发事件新闻文档的特点。包括用词特点、兼类词的使用特点以及词性搭配特点等。并对每一类特点做出了详细的实例说明。2.利用知网对已经经过分词和词性标注的突发事件新闻文档进行概念映射,通过对概念密度的计算对突发事件新闻文档进行层次的划分。3.在已经对突发事件新闻文档进行了基于概念层次的划分的基础上,对每层进行基于统计的机械摘要提取,给出了一种突发事件新闻文档的结构表示形式。
其他文献
随着信息化程度的不断加深,数据爆炸性增长,海量数据长期、高效、安全的保存备受关注。近年来蓝光光盘技术的发展,光盘存储具有低成本、低功耗、高容量、高可靠性、安全性、
本文的研究背景为四川省网络通信重点实验室(SC-Netcom Lab)提出的“多端口并发穿越测试法”(MPC-TTM)和开发的“多端口路由器并发测试系统”(MPR-CTS)。以ISO9646为代表的传
多波段图像融合是智能探测系统的关键技术之一。由于当前图像融合方法多以两幅图像为融合对象,并且需依赖先验知识选择图像分解滤波器、分解层数和融合规则等,导致融合效果存
软件体系架构是构建计算机软件实践的基础。传统的两层C/S架构存在客户端应用程序大、不利于更新和维护等缺点,随着企业业务规模的扩大,以及为了适应在Internet上开展业务服
水波面实时渲染是计算机图形学领域一个有意义并且具有挑战性的课题。水是一种流态物体,在虚拟场景中经常出现,水波面动荡的画面能够较大程度地增进整个场景的真实感。为达到
随着计算机技术的快速发展和宽带网络的进一步普及,P2P技术被誉为改变互联网未来的新技术之一,各种P2P类型应用层出不穷,但是当前的一些P2P典型应用给电信主管部门和运营商带来
远程控制的目的旨在突破地域和环境上的限制,对现场设备的运行状态及各种参数进行远程监控。尤其是在现场设备分布离散、工作环境恶劣等情况下,远程控制技术的采用实现了跨地
信息将是21世纪最赚钱的产品,而靠信息吃饭的传媒自然要好好把握这个机会,最大化的合理开发和利用自身的信息资产。正是在这种高利润的驱动下,媒体企业的IT建设更是风风火火。报
随着软件工程理论的不断发展,网络通信技术的不断完善以及社会信息化程度的提高,管理信息系统在众多领域得到广泛应用;同时随着高校规模的扩大和教学管理方式的改进,对高校教
自动取款机等自助设备在金融行业运用多年,为金融机构拓展服务时间和服务地域,提高工作效率,降低运营成本做出了巨大贡献。随着金融机构对自助设备依赖程度的不断提高,对自助设备