中文专利文本特征提取方法研究

来源 :福建电脑 | 被引量 : 0次 | 上传用户:seraph4543
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种针对中文专利文本的特征提取方法。首先使用Chi-CIG对特征进行第一次降维,再使用潜在语义标引对特征项进行第二次降维操作。使得文本的特征维数大为减少的同时,又尽可能多的保存信息。
其他文献
随着时代的发展,在国家"大众创业、万众创新"的倡导下,越来越多的大学生倾向于创新创业,并受到社会各界的广泛关注。本文试图分析大学生创新创业的现状与遇到的问题,通过问题
随着科学技术的不断进步,数据量增长迅速,人类社会活动越来越依赖数据的分析和处理,使得大数据的使用更加频繁。管理会计的本质就是在搜集企业各类的经营数据的基础上,通过科
肉毒梭菌毒素中毒是犬饲料中毒中常见的一种。该病发病急,若诊疗不当,则病死率高。本文重点对该病的临床特点及防治措施等进行了阐述,可供基层兽医工作者临床参考。
智能投顾是以大数据算法以及企业产品为依据,为投资者提供其所需的数字化、自动化、智能化的投资建议,并对投资者的财富进行支配管理的新型金融科技。我国现行多家开展智能投
文本聚类是文本挖掘的重要组成部分。本文详细分析了文本聚类的过程,并给出了一个文本聚类模型。分析比较各类聚类算法之后。着重研究了一个基于密度的聚类算法,以及它在文本挖
天津科技大学造纸学院制浆造纸工程学科是我国最早设立的制浆造纸学科,于1959年和1971年分两次从天津大学整建制调至我校(原天津轻工业学院),至今已有77年历史,2015年重新组建
为了降低造纸工业中制浆废水、中段水的环境污染负荷,同时为造纸企业降低处理费用;采用膜分离技术处理造纸工业中的制浆废水、中段水。经膜处理后的制浆废水COD控制在2000mg/1以
以天然淀粉为原料,氢氧化钠为催化剂、环氧氯丙烷为交联剂制备交联淀粉,以制备得到的交联淀粉为原料、2,3-环氧丙基三甲基氯化铵为醚化剂,采用微波辅助半干法制备交联醚化淀粉,在
内蒙古亿利冀东水泥有限公司综合利用工业废渣2500t/d生产线于2006年6月开工建设,2007年8月水泥粉磨生产线投产运行,2008年1月水泥熟料煅烧系统投产运行;该水泥生产线为100%
地铁隧道下穿既有客运专线桥梁施工中,对桥梁的沉降变形有较高要求。以郑州地铁1号线某区间隧道下穿客运专线桥梁为工程依托,根据实际工程地质条件建立了三维数值模型,通过FL