【摘 要】
:
针对传统随机森林算法在维度高、噪声大的文本分类上出现计算复杂度高和分类效果较差的问题,提出一种基于隐狄利克雷分配( LDA)主题模型的改进随机森林算法.该算法利用LDA主题
【基金项目】
:
江苏省产学研合作项目(BY2015019-30)
论文部分内容阅读
针对传统随机森林算法在维度高、噪声大的文本分类上出现计算复杂度高和分类效果较差的问题,提出一种基于隐狄利克雷分配( LDA)主题模型的改进随机森林算法.该算法利用LDA主题模型对原始文本建立 模型,将原始文本映射到主题空间上,保证了文本主旨与原始文本的一致性,同时也大大降低了文本噪声对分类 的影响;并且针对随机森林中决策树特征的随机选择方法,提出在决策树生成过程中,利用对称不确定计算各个 特征之间的相关性,从而可以降低不同决策树之间的关联度.最终在主题空间上利用改进的随机森林算法对文 本进行分类.经过实验
其他文献
针对传统图书馆与现代图书馆的管理模式,阐述了网络环境下图书馆员应具备的素质,在图书馆发展中的作用,并对现代图书馆员素质教育的途径与方式进行了探讨。
毕业设计是高职院校人才培养的一个重要实践环节,对高职院校专业人才的培养有着非常重要的作用。分析了目前动漫专业毕业设计存在的问题,提出了注重毕业设计选题实用性,加强
在线投稿系统是网络环境下期刊投稿的新方式,是学术期刊网络化进程的必然选择。通过介绍在线投稿系统的定义、种类和投稿流程,并选取19种图书馆学情报学核心期刊为样本,就华
摘要:在产品的生产与调试现场中,针对各类工业设备的使用及完成状况,以信息化的形式实现了设备所处状态的语音提醒和看板展示,方便操作人员知悉产品在设备中的进展程度,同时最大限度减少设备占用以及产品加工超时引起的损耗等情况。 关键词:设备状态;电装;语音提醒;看板 中图分类号:TP302 文献标识码:A 文章编号:1009-3044(2019)13-0201-02 1 背景 在工業生产过程中
以哈尔滨市图书馆社区分馆建设为例,在社区分馆的建设模式、运行机制、管理服务等方面进行尝试,提出了经济相对落后地区市级图书馆三级服务网络建设的模式,并对社区分馆可持续发
自2013年习近平总书记提出“一带一路”倡议以来,经过三年多的发展已经取得了丰硕成果。通过梳理外媒对这一系列成果的评价,中国经济时报记者发现“一带一路”对全球化的促进作
【摘要】《语文课程标准》对小学阶段各年级的探究性阅读和创造性阅读都有明确的规定,并对课外阅读量有了具体的规定,小学高年级学生的阅读量不少于100万字。这一数字的意义不在于量,而是通过量表明阅读的重要性,阅读是语文学习的灵魂被理论肯定了。如何加强阅读教学呢? 【关键词】小学生 阅读能力 一、创设生动的教学情境——乐读 在现代社会,信息传播空前迅速,人们的阅读处在快餐时代,学生也受到这种风气的影
本文从文化品牌选择的路径进行比较分析,认为新乡历史文化厚重影响中国历史进程的新乡名人有四大群体,十大亮点。牧野大战在历史上极具影响性,历史纪年极具关键性,牧之野具有