基于类信息的文本特征选择与加权算法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:jove110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动分类中特征选择和加权的目的是为了降低文本特征空间维数、去除噪音和提高分类精度。传统的特征选择方案筛选出的特征往往偏爱类分布不均匀文档集中的大类,而常用的TF·IDF特征加权方案仅考虑了特征与文档的关系,缺乏对特征与类别关系的考虑。针对上述问题,提出了基于类别信息的特征选择与加权方法,在两个不同的语料集上进行比较和分析实验,结果显示基于类别信息的特征选择与加权方法比传统方法在处理类分布不均匀的文档集时能有效提高分类精度,并且降维程度有所提高。
其他文献
为解决航空企业内部多个制造项目并行情况下的资源均衡问题,引入了一种适合求解并行项目资源均衡问题的数学模型,该模型可以有效地将并行多项目资源均衡问题转化为单项目资源均
摘 要 近年来,连云港市特粮特经生产坚持稳定面积、主攻单产、改善品质,提高种植效益的发展思路,特粮特经产量实现了高产、稳产。基于此,为进一步促进连云港市特粮特经生产,总结分析了2018年连云港市特粮特经生产情况,并对2019年特粮特经生产进行了展望,以供参考。  关键词 特粮特经;生产特点;生育特点;连云港市  中图分类号:F326.12 文献标志码:B DOI:10.19415/j.cnki.1
提出了一种基于提高多样性的粒子群优化算法。在速度更新公式中,将比当前粒子适应度更高的其它所有粒子的个体最优位置信息进行加权学习;在位置更新公式中,利用真实物理反弹理论
边缘是图像的重要特征。在应用细胞神经网络提取图像边缘时,网络的稳定性和参数的选择是关键。文中推导了细胞神经网络的稳定条件,并提出了网络参数的自适应设计思路。基于Matlab7.0平台,通过编写仿真程序,检测灰度图像边缘,得到良好效果。实验证明,该法还能有效抑制噪声的干扰。
给出了一种基于混沌序列的多幅图像隐藏算法。利用图像的迭代混合可以将多幅图像隐藏于一幅图像之中,借助Logistic混沌动力学系统过程既非周期又不收敛,且对初始条件敏感性,产生
对石武客运专线信号系统及各子系统间的接口方式及接口管理做了总结和分析,以供今后客运专线的施工建设参考。
摘 要 羊是一种较为温顺的动物,主要有绵羊、山羊之分,属于反刍动物。野生种绵羊的外毛下有一层羊毛,多数饲养的绵羊种类都能生产出优质羊毛,只有少数品种才能被逐渐培育成肉羊。成年绵羊的肉称为羊肉,未成年绵羊的肉称为羔羊肉。而山羊主要用于产奶,后期也被培育成肉羊。在21世纪,羊肉已成为人们喜欢的肉质食品之一。为了满足各地人们对羊肉的需求,培育优质肉羊,探究确保肉羊饲料配制营养与安全的措施。  关键词 肉
风景园林作为城市规划的重要组成部分,兼具了美化环境与提升人们精神文明生活质量的作用。而植物是风景园林设计主要元素之一,在植物配置与规划的过程中包含了多个学科的内容
研究高结合苯乙烯充油SBR1739的基本性能,并与SBR1721进行对比。结果表明,SBR1739与SBR1721的结合苯乙烯相对分子质量相同,相对分子质量分布和加工性能相近。与SBR1721胶料相
美国《现代轮胎经销商》(www.moderntiredealer.com)2009年4月29日报道:荷兰破产法庭已经批准阿波罗轮胎有限公司提出的从俄罗斯轮胎制造商Amtel-Vredestein公司手中获取荷兰Vrede