基于语义关系的摘要提取

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:dkmlyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,电子文本大量涌现,自动摘要提取以迅速、快捷、客观等手工摘要无可比拟的优势,使得其实用价值得到充分体现。摘要提取越来越受到人们的重视。传统的自动摘要提取方法基于词频统计提取摘要句,对文本不进行语义分析,导致摘要质量不高。 为了克服传统方法的缺点,本文在机械摘要方法基础上,提出了一种基于语义关系的摘要提取方法。以非受限区域的文本为处理对象,利用WbrdNet,HowNet中的语义关系构建层次结构图,使用改进的概念重要度计算参数,对由文章词语生成的层次结构图进行合理的优化剪枝操作。用最终归纳得到的关键概念代替具有同义词关系的词语,统一词语样式,提高向量空间模型表示文章内容的准确性。同时更加准确的识别文本中的同义句。基于语义关系的摘要提取方法将机械摘要处理文本的任意性和理解摘要的摘要质量较好的优点集中在一起。 同时,在基于语义关系的关键字提取基础上,根据已有的两种文本结构分析方法——基于段间相关度主题划分方法和基于词语重复度的主题划分方法,提出了基于段间特征词重复的主题划分方法,这种方法综合了已有的两种方法的优势,具有准确快速的优点。大量实验表明,我们提出的新方法具有较高的正确性,特别适合文档内容相似,用词差异较大的情形。
其他文献
随着社会的发展,人们希望在移动中保持Internet接入和持续通信,获得如固定接入一样的网络服务质量。但原来IP协议对网络节点的移动性支持不够。移动IPv6作为IPv6的一个组成部
简单网络管理协议(SNMP)作为事实上的工业标准得到了众多厂商的支持,并在大多数的网络设备和系统中得以实施。但是开发基于SNMP的网络管理应用通常需要领域知识较强的开发人员
下一代移动通信系统将是全IP移动通信系统,其移动性管理策略由移动PPP协议和移动IP协议这两个重要的支撑协议组成。而如何将Diameter技术和移动性管理技术融合实现AAA(Authen
传统的数据挖掘基本上是一个本地的数据分析工具,仅能对本地数据集产生一定的理解性或概括性的知识。随着数据存储容量的不断扩大并向分布式方向发展,迫切需要更好的方式和工
本文中提出并实现的基于uC/OS-Ⅱ的交换机计费采集器从电信的实际需求出发,充分利用嵌入式“以应用为中心”的特点,根据本应用的需求,适当地选择硬件、嵌入式操作系统并进行“当
随着互联网和PC机的发展,分布式计算已变得非常流行。毫无疑问,互联网改变了我们的生活。但影响我们对互联网兴趣的一个方面是,计算机往往处于空闲状态,等待我们点击网页或按键。
随着互联网和电子商务的迅速发展,Web已经成为成熟的网络平台。在Web平台上提供的信息服务也多不胜数。Web平台因其开放性和跨平台等特性受到普遍欢迎。然而现时为止,在Web平台
本论文的研究工作,主要围绕着基于粗糙集理论的动态约简和完成约简后决策规则的如何制定展开。涵盖了粗糙集理论的基本原理、不同决策表抽样策略的分析、如何利用差别矩阵和差
设备状态监测和故障诊断技术近年来迅猛发展,它有效地保证了设备的平稳运行,并在设备预知维修中发挥越来越重要的作用。 本课题应用数据采集、信号处理、故障诊断、数据库
在基于属性的签名系统中,每一个用户都有自己的属性集合,用户签名的能力完全依赖于自己具有的属性。基于属性的签名协议需要具备的第一个性质是不可锻造性,即给定一个消息,只