中文专利自动分类技术的研究

来源 :沈阳航空工业学院 沈阳航空航天大学 | 被引量 : 8次 | 上传用户:asd710601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利分类可以加快对专利文献的检索速度,并方便对专利文献的管理,有着十分重要的作用。目前我国的专利申请数量逐年提高、增长迅速,传统的人工分类方法已经越来越难以进行,所以实现中文专利的自动分类有着重要的意义。本文详细介绍了专利分类的背景和研究现状,并给出了专利分类问题的定义。在详细分析各项分类技术的基础上,本文重点研究了专利分类中的特征选择、特征权重计算、分类方法等三个主要问题。具体内容如下:1.提出了基于IPC领域知识的特征选择方法。该方法在特征选择中引入了IPC领域知识,为每个类别建立概念空间,并通过特征与概念空间的相关性来选择特征。2.提出了基于主题的特征权重计算方法。该方法将专利的标题作为主题,并通过考察特征与主题的相关性来确定特征的权重,使专利的文本表示更趋近于文章的主题。3.提出了一种多分类器融合方法。该方法通过考察各基本分类器的效果来确定权值,并根据权值对多分类器进行线性融合。本文在标准专利分类语料上,对上述方法进行了对比实验。实验结果表明,本文提出的特征选择方法能够提高分类的精度,但复杂度过高;本文提出的特征权重计算方法优于传统的方法,能有效的改善分类效果;本文提出的分类器融合方法能够有效的提高分类精度。
其他文献
嵌入式计算理论和体系结构的研究始终拥有强大的应用需求背景,物联网、智能电网、智能医疗、智能性消费性电子、智能建筑、智能汽车、环境监控的兴起,为嵌入式带来了巨大的发
计算机应用的不断发展导致了数据量的急剧增加,由于数据结构化过程受限于人工处理速度,导致非结构化数据的增长速度远远大于结构化数据。传统上使用文件目录树组织管理大规模
随着汽车电子产业的不断发展,目前汽车电子嵌入式系统的规模越来越大、复杂程度越来越高、开发维护成本也越来越高。为了应对这样的问题,通过降低软件组件之间的耦合度、提高
用户界面在软件系统的人性化、个性化、智能化等方面扮演着非常重要的角色,用户界面的可定制性是计算机软件技术研究中极其重要的问题之一。关于一般计算机软件系统的用户界
TCP(Transmission Control Protocol)是互联网中的一个重要协议,在互联网中得到了广泛的应用。提升TCP服务的性能可以降低服务器集群的数量,降低功耗,具有很高的商业价值和环
随着计算机技术在信息化系统中的广泛应用,特别是在航空、航天系统以及一些军事通讯等安全关键领域中的推广,使得软件业对软件的安全性,可靠性提出了更高的要求,因为在这些系
学位
NTRU公钥密码体制是由三位美国数学家J.Hoffstein,J.Pipher和J.H.Silverman于1996年提出来的,其安全性基于最近向量问题。NTRU算法的发明是计算机密码学界的一个重大成果,它
智能手机已经成为人们日常生活当中不可或缺的通信交流工具,通过智能收集可以随身随地的获取位置、通话记录、短信、微信等体现人们之间日常交互和社会关系的各种信息,人们之
近年来,脑科学研究成为了先进国家的重点研究领域,欧盟、美国、日本等国家相继提出各自的脑计划。研究人脑机理不仅能够加深对人脑的认识,由此促进脑疾病的治疗技术的发展,并