一种基于权重的文本特征选择方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:housekingzuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分析比较几种常用的特征选择方法的基础上,提出了一种引入文本类区分加权频率的特征选择方法TFIDF_Ci。它将具体类的文档出现频率引入TFIDF函数,提高了特征项所在文档所属类区分其他类的能力。实验中采用KNN分类算法对该方法和其他特征选择方法进行了比较测试。结果表明,TFIDF_Ci方法较其他方法在不同的训练集规模情况下具有更高的分类精度和稳定性。
其他文献
P-推理(packet reasoning)是由P-集合(packet sets)的结构与动态特征得到的。P-推理由内P-推理(internalpacket reasoning)与外P-推理(outer packet reasoning)构成,具有动态特性与"序
多数识别技术通过建立流特征的正常模型来识别偏离的流,但流特征有较强的可变性,建立这样精微的模型非常困难。异常的发生通常会引起流量地址或端口在分布上的变化,分布的分
在解码转发协议的基础上,研究了全选中继策略和机会中继选择策略的中断概率性能,推导了瑞利衰落下的两种策略的中断概率精确闭式结果,给出了高信噪比时的中断概率近似表达式
基于文献[18]提出的量子程序验证方法,讨论了单量子比特系统上比特翻转、去极化、幅值阻尼、相位阻尼等信道刻画的量子程序的验证,通过选取不同的可观测算子对程序终止的情况
为了改善传感器的气敏性能,采用溶胶—凝胶法合成了介孔SnO2,并研究了其气敏性能。研究表明:与纳米SnO2相比,介孔SnO2气体传感器具有较高的酒精、二甲苯响应,在100~150℃对甲醛
通过对主流即时通信软件的通信机制进行分析,解析整理出多种即时通信文本传输协议,设计并实现了一个即时通信统一监控管理系统-IMSMMS。IMSMMS通过会话关联,解决了先前的消息
为了提高语音端点检测的适应性和鲁棒性,提出一种基于小波分析和支持向量机的语音端点检测算法。首先利用小波变换提取语音信号的特征量,然后将这些特征量作为支持向量机的输
针对三维Shepp-Logan头模型投影仿真,提出了一种快速并行投影计算方法。首先依次计算三维射线与各椭球的交点,然后对交点序列进行排序,用排序后的交点序列来确定射线穿过模型的区域编号及长度,最后将每个区域内的投影累加得到射线的投影值。在此基础上,将计算任务分解为4个独立的子任务,通过多线程技术在多核平台上实现了锥束CT仿真投影的快速并行计算。实验结果表明,该方法非常有效,在四核平台上取得了约3.
随着近年来太阳能光伏发电技术的发展,高精度太阳位置跟踪技术越来越重要。但是一般传感器在保证了高精度情况下往往忽略了跟踪范围因素,导致传感器经常出现因跟踪范围小而搜索
多点中继选择算法是一种泛洪技术,可用于移动自组网中信息的有效传播,减少不必要的节点选取及网络中数据包冲突的数量,从而达到节约节点能量、延长移动自组网的生存周期以及