基于修辞结构理论的文本结构自动分析

被引量 : 0次 | 上传用户：and113

【摘要】

：

随着Internet的普及和信息技术的快速发展，每天都有大量的信息如潮水般涌入互联网浩如烟海的信息使我们越来越无所适从，不知道哪些信息才是我们所需要的由于网络上的信息多数是

【作者】

：

王鹏

【发表日期】

：

2014年期

【关键词】

：

RST 修辞分析词典修辞结构树修辞分析算法文本结构分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet的普及和信息技术的快速发展，每天都有大量的信息如潮水般涌入互联网浩如烟海的信息使我们越来越无所适从，不知道哪些信息才是我们所需要的由于网络上的信息多数是以文本的形式存在的，因此文本的有效处理是我们从互联网上获取信息的重要前提自动分类文本聚类自动摘要等技术是现在文本处理的主要手段，它们在文本分析和人们的信息获取中发挥了极大的作用但是由于这些方法大多是建立在向量空间模型和统计的方法基础之上的，文本中的语义信息总是存在一定的损失，不能完整的体现原文的含义，一定程度上影响了摘要和聚类等处理结果的精度从文本作者的角度来看，段落句子在文本中的位置，以及一些特定的语句的顺序和关系，也是文本所要表达的内容的一部分，是读者理解文本的重要的角色因此要实现文本在语义上的完整理解，必须要对文本在结构上进行详细的分析修辞结构理论（RST）是一套关于自然语篇结构描写的理论，被广泛地应用于各种类型文本的分析本文对修辞结构理论进行了研究，并将其应用于中文文本结构的自动分析中首先从汉语语篇的结构特点入手，分析了修辞结构理论在描述中文文本结构中的作用，构建出了用于修辞结构分析的修辞分析词典然后利用该词典，设计实现了一个构建中文文本修辞结构树的分析算法，为后续的自动文摘等方面的研究打下了良好的基础本课题的研究主要包括以下的内容：第一，深入理解修辞结构理论的基本术语基本假设和核心概念，结合汉语语篇的结构特点，分析修辞结构理论在描述中文文本结构中的作用，为进一步的研究提供理论支撑第二，通过对语料进行初步分析确定本研究使用的修辞关系集合，对连词的词频进行统计后选出高频的连词，并获得每个连词的具体用法，建立修辞分析词典在此过程中，尽可能的考虑连词在连接语段构成句子过程中起作用的各种因素，精心设计词典的结构特别地，在词典中加入搭配词字段，使分析准确率获得了很大程度的提升另外将词典构建为xml格式的文件也便于进行学术交流第三，利用建立好的修辞分析词典编写修辞分析算法，从段落和句子两个层次对文本建立修辞结构树综合考虑了标点符号和连词在文本中的连接作用，充分利用搭配词来考虑小句之间的关系，并制定了一定的规则对修辞结构进行排歧，最终的目标是构成没有歧义的完整的修辞结构树在编写算法的过程中，注意了程序的复用，两个层次的算法有些是共用的同时也考虑了算法的可扩展性，程序很容易增加其他模块而只需要修改少量代码，便于以后对程序进一步扩充

其他文献

海上石油平台噪声危害现状及对作业工人听力及常见疾病影响研究

目的：调查分析海上石油平台上生产性噪声的分布特点、作业工人接触噪声的特点以及平台对噪声的防护措施；研究在海上石油平台这一特殊的生产环境下,海上石油平台作业工人特殊的

学位

噪声海上石油平台听力职业健康体检工种年龄

库伦旗：流动党员管理的三项制度

库伦旗建立三项制度,加强流动党员管理。一是建立流动党员管理责任制。明确各基层党支部书记是流动党员管理工作第一责任人,建立党支部委员定点联系流动党员工作机制。按照就

期刊

流动党员管理库伦旗三项制度

开发科学思维,激发创新精神——复旦大学“医学文献检索与利用”课上海市市级精品课程建设思考与实践

<正>本文基于上海市市级精品课程建设,阐述医学文献检索与利用课程的教学设计、近年来课程内容改革以及课程实践效果。对如何开发学生科学思维,激发学术创新精神,提出了医学

会议

成果为导向的建筑设备课程教学创新

《建筑设备》课程是建筑学专业建筑技术方向的必修课程,传统的课程教学集中在给排水、暖通空调、建筑电气知识点的讲解,随着可持续建筑和绿色建筑技术的发展,目前的教学内容

期刊

成果导向建筑设备教学改革职业建筑师

液压仿真技术在锻压设备中的应用及展望

随着工业产品朝着几何形体复杂化和加工质量的高精度化方向发展,锻压设备的结构及控制系统也越来越复杂.本文对国内外有着广泛影响的几个典型的仿真软件进行了剖析,讨论了仿

期刊

计算机应用液压仿真锻压设备共仿真应用

颜文樑实用美术教育思想研究

20世纪初，中国面临着巨大的社会动荡，各种要求改革的呼声此起彼伏，同时文化教育方面的改革呼声随着新文化运动的开始而愈演愈烈。中国的传统文化和西方的先进思潮不断碰撞出火花

学位

颜文樑实用美术教育思想高校美术教育

高中政治课教学中渗透心理健康教育研究

面对繁重的学业负担，严峻的高考挑战，以及社会快速发展造成的日益加大的竞争压力，高中生的心理健康问题越来越突出。学校必须重视高中生的心理健康状况，加强对他们的心理健康教育

学位

高中政治学科渗透心理健康教育

汽车复合材料碰撞吸能装置设计与仿真方法研究

汽车被动安全一直是国内外研究的热点，且其安全性能的优劣很大程度取决于汽车外部保护部件——保险杠系统的碰撞性能。本文主要对汽车保险杠部位的碰撞吸能装置进行研究：在总结

学位

汽车碰撞吸能复合材料结构设计碰撞仿真

炮兵侦察战斗作业与训练模拟系统的设计

随着当代科学技术的发展,特别是以电子计算机为代表的高科技群的发展及其在军事领域的应用,炮兵侦察战斗作业和训练的手段越来越先进。现代战争中,炮兵在遂行作战任务时,由于

学位

模拟器材炮兵侦察三维地形战斗作业与训练

应激对北京鸭血液指标、肉品质及组织hsps mRNA转录水平的影响

动物保护和动物福利被越来越多的国家所重视,尤其是欧盟国家,在制定和实施农业政策时,都必须要充分考虑到动物的福利。应激作为评价动物福利的重要指标之一,已成为动物福利工

学位

北京鸭噪声应激运输应激维生素E宰前休息热应激蛋白

基于修辞结构理论的文本结构自动分析

与本文相关的学术论文