基于神经网络的专利文本分类系统的研究

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:zxjln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利信息作为重要的信息资源,越来越受到人们的重视。目前,专利分类采用传统的手工分类方法,存在分类周期长、费用高、效率低、一致性差等缺点。近年来,随着专利申请数量的迅速增长,传统的手工分类方法不再能满足人们的需求。因此,专利自动分类成为重要的研究课题。   本文首先介绍了文本分类技术的研究现状,并对专利文本结构的特殊性进行说明。然后,对中文文本分类过程中的关键流程和关键算法进行说明。接着,基于以上理论,结合专利文本的特点,提出专利文本自动分类系统的设计方案,实现专利文本自动分类系统,并通过多次实验对系统的分类性能进行评价和分析。本文对传统的权重计算方法和特征选择方法进行了改进,因而取得了较好的分类效果。论文的最后,对研究中存在的问题进行了总结,并对今后的研究工作进行了展望。
其他文献
多视点视频(Multi-View Video,MVV)是由一系列摄像机处在不同位置从不同角度同时拍摄同一场景得到的一组视频信号,其蕴含丰富的深度信息,对自然场景更具有真实感。MVV的数据量随
随着电信事业的不断发展,加剧了电信业务的广泛普及,因此电信研究院针对电信投资项目的统计评估工作也越来越繁重,加之对数据管理的复杂性和难维护,加剧了投资效益评估这项工
计算机的使用改变了我们的世界,并且也使得我们对它的依赖性越来越大,每天有大量的重要信息被存储在其中,一旦数据丢失或损坏,人们将蒙受巨大的损失。数据恢复技术就是信息安全的
在Web2.0时代,网络已逐渐由用户单纯地浏览信息发展到更加侧重用户的交互,这产生了一类重要的用户数据:大规模富含情感信息的Web资源。面对如此大规模的情感文本,如何能通过计算
多参数监护仪可以对病人进行长时间的、连续的自动实时监护,能提供多种生理参数的测量和分析,有利于医生及时了解患者的病情变化,是现代化医院不可缺少的医疗设备。由于我国
随着计算机技术和网络技术的飞速发展,现有的搜索引擎虽然采用了各种方法来提高信息的检索精度,但是相关的文档和不相关的文档仍相互混杂,给用户带来了很大的负担。因此,如何快速
时-频分析是信号处理中的重要手段之一。作为经典的时频分析工具Fourier变换建立了信号从时域到频域的桥梁。但它反映的只是整个信号在全部时间下的整体频域特征,而不能提供
在21世纪,以网络通讯技术和多媒体技术为核心的信息技术的迅猛发展在社会的许多领域中引发各种深层的变革,从而加速了人类迈向信息社会的步伐。教育信息化是当今世界教育发展
本文对NTFS文件系统进行了较为深入的研究,系统论述了NTFS文件系统中的各主要的数据结构,并动态分析了NTFS文件系统中各数据结构之间协调工作的原理,并且设计了一个嵌入式NTFS文
随着HT-7、EAST托卡马克物理实验的不断深入,更多的物理论断应用到实验中来,数据量较过去有了爆发性的增长,信号采样频率、数据存取速率、网络带宽等方面都有了新的要求。不
学位