基于语义增强的改进混合特征选择的文本分类

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:chenyanzhao12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何从文本中抽取出能够体现文本特点的关键特征,抓取特征到类别之间的映射是文本分类核心问题之一。传统的词袋模型的优点是将每个词视为一个特征,而缺点是计算成本会随特征数量和文本与特征之间的关系的增加而增加,并且没有考虑文本特征自身的语义关系,语义关系的优势是获取文本和特征之间的相关性。针对这个问题,提出一种增强混合特征选择方法,该方法使用混合特征选择进行降维,然后再使用词向量对低频词进行语义增强。为了验证增强的混合特征选择对文本分类的作用,构建了两个实验,使用LSTM算法进行分类模型训练与测试。对爬取的718
其他文献
苏霍姆林斯基说过:“世界上没有任何东西比人、的个性更复杂,更丰富多彩。”每个学生都是一个丰富多彩的世界,习作作为最能展现学生个性的途径.展现的应该是学生内心最真实的一面
在《语文课程标准》里“综合性学习”和“识字与写字”、“阅读”、“写作”、“口语交际”共同组成语文学习的五大板块,而综合性学习最终成为我国当前语文课程改革的一大亮点
期刊
在多目标进化算法解决多目标优化问题的过程中,随着目标个数的增加,种群个体进化方向的盲目性逐渐显露出来,同时还存在着收敛性和多样性难以平衡的问题。针对以上两个问题,以
期刊
知识经济是一场伟大的社会变革,这场变革必然深刻影响着人类社会的各个领域。面对知识经济时代的来临,档案工作如何转变观念,适时应变,调整服务内容,改善工作方式,提高服务水平和质
摘要济麦22系山东省农业科学研究所育成的优质高产广适小麦新品种,介绍该品种在灌南县的引进种植表现,针对济麦22的特征特性,对单产9 000 kg/hm2以上的田块超高产栽培技术进行介绍,以为济麦22在灌南县的推广种植提供参考。  关键词济麦22;特征特性;高产;栽培技术;江苏灌南  中图分类号S512文献标识码B文章编号 1007-5739(2010)24-0095-01    济麦22(9841
在长期教学过程中,笔者发现学生由于不能正确选取适当的翻译单位而使得译文语言晦涩、文理不通、结构混乱、逻辑不清。为了能有效提高学生的翻译能力和水平,特将英汉翻译中的单
本文阐述了双连拱隧道的开挖原理、开挖方法以及混凝土仰拱施工等技术,以供双连拱隧道施工参考借鉴。
教师的提问是打开学生思维的金钥匙。问题的宽窄深浅直接影响着学生思维的广度和深度,面对新一轮的课程改革,有些教师的观念还比较落后,提问的形式和内容趋于简单化,特别是对问题