基于SVM的中文书目自动分类及应用研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:marquise
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将文本自动分类技术应用于图书书目的自动分类中,利用ICTCLAS分词系统对书名和摘要信息进行中文分词,为标题和摘要的特征词赋予不同的权重。在构建基于文本特征矩阵的基础上,结合SVM算法对实验语料进行学习和测试。为了验证TFIDF权重对分类结果的影响,还对词频特征矩阵、TFIDF特征矩阵和混合特征矩阵进行测试和对比。实验证明,基于混合特征矩阵的SVM算法具有良好的分类效果。据此,构建基于SVM的书目自动分类系统。
其他文献
我国经济法肇始于1978年改革开放的巨大变革时代,立足于我国转型经济的现实土壤,历经“有计划商品经济”到市场经济的跃迁,在我国波澜壮阔的经济体制改革进程中成长壮大。自身成
<正>二○一三年九月二十七日,河南省博物院和北京大学考古文博学院,联合国内近二十家文博单位在河南省博物院举办了一个"鼎盛中国——中国鼎文化展"。这个展览本来是为了向中
兴趣对于学习是十分重要的,它分为直接兴趣和间接兴趣两种。在高职高等数学课程教学中尝试从多角度培养和激发学生的学习兴趣,总结出激发和保持学生学习兴趣的方式、方法,使
现金贷是指无场景依托、无指定用途、无客户群体限定、无抵押特征的消费贷款,具有借款周期短、金额小等特点。其优势在于手续简单、快速批款,对于急需用钱的人来说非常方便。$$
报纸
目的:制备胃癌血管靶向肽GX1介导的载紫杉醇靶向纳米脂质载体(GX1-PTX-NLCs),并对其制剂学性质、体外释放及稳定性进行考察。方法:采用乳化溶剂挥发法制备纳米脂质载体,并以
随着新课改的不断深入,我国高校在培养人才过程中,教育不断向大众发展。这一环境下,高校教育大众化带来了很多问题,最为显著的便是高校人才培养的整体质量不断下滑。人才培养
应用高分辨率层序地层学理论,对东营凹陷梁家楼地区沙三段上亚段-沙二段下亚段三级层序低位体系域砂体进行了研究.认为该体系域的主要沉积体系是由早期西部(纯47)、晚期东部(
最近,受到自清洁荷叶效应的启发,采用静电纺丝技术制备具有微纳米阶层结构的超疏水纳米纤维膜得到了广泛的研究。但是,要制备具有柔韧性,耐高温的能在极端环境下使用的超疏水
用常规调查分析结合自动监测法对桑沟湾海水中悬浮颗粒物的季节性变化、水平与垂直分布作了全面的调查。结果表明,该湾总悬浮颗粒物和有机悬浮颗粒物的月平均数量变动范围分别