一种文本特征选择方法的研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:lmtc5238
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类中,对高维的特征集进行降维是非常重要的,不但可以提高分类精度和效率,也可以找出富含信息的特征子集。而特征选择是有效降低特征向量维数的一种方法。目前常用的一些特征选择算法仅仅考虑了特征词与类别间的相关性,而忽略了特征词与特征词之间的相关性,从而存在特征冗余,影响了分类效果。为此,在分析了常用的一些特征选择算法之后,提出了一种基于mRMR模型的特征选择方法。实验表明,该特征选择方法有助于提高分类性能。
其他文献
1资料与方法1·1一般资料患者刘**,男,26岁,因“腹部、腰背部、双膝部疼痛5+小时”于2012-3-29入院。5+小时前患者为治疗腰椎疾病服用含马钱子成分中药后出现剧烈腹部、腰背部、
全球最大的铁矿——巴西卡拉加斯铁矿(Carajás Mine)世界上最大的铁矿是巴西的卡拉加斯铁矿(Carajás Mine),面积达83万平方千米。其发现的过程颇有戏剧性,某美国公
随着Internet技术的不断发展和人们对地理信息系统(GIS)的需求,利用Internet在Web上发布和出版空间数据,为用户提供空间数据浏览、查询和分析的功能,已经成为GIS发展的必然趋势。Web是GIS系统信息最好的载体。传统C/S模型的WebGIS系统在空间上存在很大的局限性,为了方便用户能在Internet上直观看到地理信息数据,文中提出了基于B/S模型的WebGIS实现方法,该方法降低
目的比较硬膜外复合七氟醚吸入快通道麻醉与静吸复合全麻应用于乳腺癌根治术的安全性及有效性。方法将68例择期行乳腺癌根治术患者随机分为观察组(硬膜外复合七氟醚吸入快通道
国务院近日印发《关于促进海运业健康发展的若干意见》,加快推进海运强国建设。这是我国首次把促进海运业健康发展上升为国家战略,引发业界极大关注和强大反响。本期船运圆桌邀
河北省西部山区山间盆地型地热热储主要受构造控制。在勘查过程中,采用电阻率法和激发极化法等综合物探方法,对勘查区进行地质分层、构造圈定以及判断断裂构造的富水性等地质
在研究和分析各种人脸检测与定位算法的基础上,并以计算简单、速度快、能精确地提取视频序列中的人脸为原则,提出了一种新的基于运动信息与边缘投影函数相结合的视频序列中的人脸检测与定位算法。该算法设计了双阈值Sobel算子进行边缘检测,该算子检测到的图像边缘清晰、细致、噪声少;提出了平方投影函数,该投影函数不但可区分均值相同的区域,而且可区分方差相同的区域。将边缘函数与投影函数结合起来设计的人脸检测与定位
艾芬豪矿业公司(Ivanhoe Mines)是一家加拿大矿业公司,该公司的前身是一家由弗里兰德(Friedland)于1993年成立的合资公司,在1994年改名为非洲矿产(African Minerals),作为其
常言说:“巧妇难为无米之炊”,这句富有哲理的名言同样也适用于写作。一个人如果腹中空空,写出的文章必然枯燥乏味,只有半时广泛阅读,注意搜集文字和生活的素材,作文时才能得
期刊
全球最大的锡矿(矿石量)——皮廷加锡矿(Pitinga)皮廷加锡矿是世界矿石量最大的锡矿山,位于巴西,是一座露天矿山,品位为0.20%。其中一个矿体(马代拉矿体)长约2km,上部风化带