论文部分内容阅读
为了提高中文图书自动分类的效率,解决图书编目人员手工分类难以适应快速增长的图书出版量的问题,本文提出了一种基于极限学习机(ELM)和混台特征的中文图书分类模型·通过LDA主题模型获取图书摘要信息中的主题分布、TF-IDF模型获取图书标题中的特征信息,并将二者组合起来构成图书的混台特征,在此基础上使用极限学习机算法构建出面向中图法的层次分类器.实验表明,基于ELM和混台特征构建的层次分类器在中图法的第1层、2层和3层分类效果可分别达到89%、84%、79%,相比传统的支持向量机(SVM)算法分类效