基于类信息的文本特征选择与加权算法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：jove110

【摘要】

：

文本自动分类中特征选择和加权的目的是为了降低文本特征空间维数、去除噪音和提高分类精度。传统的特征选择方案筛选出的特征往往偏爱类分布不均匀文档集中的大类，而常用的TF

【作者】

：

吕震宇林永民赵爽陈景年朱卫东

【机构】

：

河北理工大学经济管理学院,北京交通大学计算机与信息技术学院

【出处】

：

计算机工程与应用

【发表日期】

：

2008年20期

【关键词】

：

文本分类特征选择特征加权基尼指数 text categorization feature selection feature weighting Gini

【基金项目】

：

国家自然科学基金（the National Natural Science Foundation of China under Grant No.60503017）,唐山市重点实验室项目（No.06360307A-6）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本自动分类中特征选择和加权的目的是为了降低文本特征空间维数、去除噪音和提高分类精度。传统的特征选择方案筛选出的特征往往偏爱类分布不均匀文档集中的大类，而常用的TF·IDF特征加权方案仅考虑了特征与文档的关系，缺乏对特征与类别关系的考虑。针对上述问题，提出了基于类别信息的特征选择与加权方法，在两个不同的语料集上进行比较和分析实验，结果显示基于类别信息的特征选择与加权方法比传统方法在处理类分布不均匀的文档集时能有效提高分类精度，并且降维程度有所提高。

其他文献

基于人工免疫算法的航空多项目资源均衡技术

为解决航空企业内部多个制造项目并行情况下的资源均衡问题，引入了一种适合求解并行项目资源均衡问题的数学模型，该模型可以有效地将并行多项目资源均衡问题转化为单项目资源均

期刊

多项目资源均衡免疫算法资源方差aerial multi-projectresource levelingartificial immune algo

连云港市2018年特粮特经生产情况分析及展望

摘要近年来，连云港市特粮特经生产坚持稳定面积、主攻单产、改善品质，提高种植效益的发展思路，特粮特经产量实现了高产、稳产。基于此，为进一步促进连云港市特粮特经生产，总结分析了2018年连云港市特粮特经生产情况，并对2019年特粮特经生产进行了展望，以供参考。　　关键词特粮特经;生产特点;生育特点;连云港市　　中图分类号：F326.12 文献标志码：B DOI：10.19415/j.cnki.1

期刊

特粮特经生产特点生育特点连云港市

一种新的基于提高多样性的粒子群优化算法

提出了一种基于提高多样性的粒子群优化算法。在速度更新公式中，将比当前粒子适应度更高的其它所有粒子的个体最优位置信息进行加权学习；在位置更新公式中，利用真实物理反弹理论

期刊

粒子多样性粒子群优化算法物理反弹理论适应度函数diversity of particlesParticle Swarm Optimization（PS

基于参数自适应CNN的灰度图像边缘检测

边缘是图像的重要特征。在应用细胞神经网络提取图像边缘时,网络的稳定性和参数的选择是关键。文中推导了细胞神经网络的稳定条件,并提出了网络参数的自适应设计思路。基于Matlab7.0平台,通过编写仿真程序,检测灰度图像边缘,得到良好效果。实验证明,该法还能有效抑制噪声的干扰。

期刊

边缘检测细胞神经网络稳定性模板参数自适应edge detection Cellular Neural Network（ CNN ） stabi

一种基于混沌序列的多幅图像隐藏算法

给出了一种基于混沌序列的多幅图像隐藏算法。利用图像的迭代混合可以将多幅图像隐藏于一幅图像之中，借助Logistic混沌动力学系统过程既非周期又不收敛，且对初始条件敏感性，产生

期刊

数字图像混沌序列图像隐藏迭代置乱digital image chaos sequence image hiding iterative s

浅谈石武客运专线信号系统接口管理

对石武客运专线信号系统及各子系统间的接口方式及接口管理做了总结和分析,以供今后客运专线的施工建设参考。

期刊

客运专线信号系统系统集成接口管理passenger dedicated railway line signaling system system i

确保肉羊饲料配制营养与安全的措施探究

摘要羊是一种较为温顺的动物，主要有绵羊、山羊之分，属于反刍动物。野生种绵羊的外毛下有一层羊毛，多数饲养的绵羊种类都能生产出优质羊毛，只有少数品种才能被逐渐培育成肉羊。成年绵羊的肉称为羊肉，未成年绵羊的肉称为羔羊肉。而山羊主要用于产奶，后期也被培育成肉羊。在21世纪，羊肉已成为人们喜欢的肉质食品之一。为了满足各地人们对羊肉的需求，培育优质肉羊，探究确保肉羊饲料配制营养与安全的措施。　　关键词肉

期刊

肉羊饲料配制营养安全

风景园林设计的植物配置与规划探析

风景园林作为城市规划的重要组成部分,兼具了美化环境与提升人们精神文明生活质量的作用。而植物是风景园林设计主要元素之一,在植物配置与规划的过程中包含了多个学科的内容

期刊

风景园林设计植物配置规划

SBR1739与SBR1721的性能对比研究

研究高结合苯乙烯充油SBR1739的基本性能,并与SBR1721进行对比。结果表明,SBR1739与SBR1721的结合苯乙烯相对分子质量相同,相对分子质量分布和加工性能相近。与SBR1721胶料相

期刊

充油SBR理化分析硫化特性物理性能

阿波罗获取Vredestein公司100％的股权

美国《现代轮胎经销商》（www．moderntiredealer．com）2009年4月29日报道：荷兰破产法庭已经批准阿波罗轮胎有限公司提出的从俄罗斯轮胎制造商Amtel-Vredestein公司手中获取荷兰Vrede

期刊

阿波罗股权轮胎制造商经销商俄罗斯荷兰

基于类信息的文本特征选择与加权算法研究

与本文相关的学术论文