基于SVDD的特征选择方法研究及其应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zxg668888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在癌症分类问题中,基因表达数据的维数成千上万,并且某些特征之间存在相关性。因而如何从大量的高维基因表达数据中快速提取出具有有用信息的低维数据越来越受到研究人员的关注。本文深入研究了基于支持向量数据描述(Support Vector Data Description,SVDD)的特征选择方法,并将其应用到基因表达数据的选择中,剔除不相关的、冗余基因,保留包含信息量多的基因,从而提高癌症的分类性能。本文的创新之处在于:提出了一种基于SVDD模型的快速特征选择算法。基于支持向量数据描述的特征选择方法已经被提出,但是其计算量较大,特征选择时间过长。针对此问题,本文提出了一种基于支持向量数据描述的快速特征选择算法。新方法的特征选择是通过对SVDD形成的超球体球心方向上的能量排序来实现,并且采用了递归特征消除方式来逐渐剔除掉冗余特征。在Leukemia和Colon Tumor数据集上的实验结果表明,新方法能够快速地进行特征选择,且所选择特征对后续的癌症分类是有效的。提出了基于多SVDD模型的快速特征选择算法。上述提到的基于SVDD的特征选择算法,仅对一类数据进行训练,忽略了其他类别的数据,只适用于一类或者两类数据。然而,实际生活中多类数据更为常见。针对多分类问题,本文提出了一种基于多SVDD的快速特征选择算法。该算法对每类数据建立一个SVDD特征选择模型,因而可以选择出多个特征子集,最后将所选择的特征子集融合起来,得到更有效的特征子集。在两个两类癌症数据和三个多类癌症数据集上的实验验证了本文方法可以选择更具有辨别力的特征子集。
其他文献
创新团队以它创新、高效的竞争作用与灵活多样的抗风险能力而受到企业的青睐。通过以百度的创新团队建设作为案例分析,得出优秀的创新团队应具备"优秀的领军人才,明确的愿景
<正>9月初,岛内知名猪油品牌强冠企业被台检调系统查获向屏东等地下工厂购入地沟油、废食用油、回锅油制成香猪油贩卖食品业者,引发全台舆论哗然。此后地沟油事件一路延烧。
芦苇为禾本科高大草本植物,地下茎发达,自生能力强,蔓延比较快,在我国各地都有分布。芦苇在医用、作为食用菌和蔬菜栽培基质、饲料等方面都有重要的开发利用价值。另外,本文
主观解释论与客观解释论都是极端的解释立场,应采用以主观解释为主、客观解释为辅的折衷说。客观解释论有其存在的合理性,不过其蕴含了突破刑法规范的内在冲动,从解释主体、
6-氧-甲基鸟嘌呤-DNA-甲基转移酶(O6-methylguanine-DNA methyltransferase MGMT)属DNA修复蛋白,普遍存在于原核生物和人体细胞内。染色体的10q26位处属于MGMT的编码基因,其
目的对比分析瑞舒伐他汀、辛伐他汀治疗高脂血症伴发冠心病疗效。选取我院2015年2月~2016年8月收治的100例高脂血症伴发冠心病患者。随机分为对照组和观察组各50例。对照组给
目的:①构建pcDNA5-TRIM28重组质粒,建立可诱导稳定表达pcDNA5-TRIM28-HEK293细胞系。②探讨TRIM28基因在分子水平的调控作用及其在肿瘤中的表达。③TRIM28与肿瘤相关性及机
在考虑活塞组-气缸套固体部件间瞬态导热的基础上,把柴油机缸内燃气、活塞、活塞环、润滑油膜、气缸套和冷却介质作为一个耦合体,将三维瞬态热传导模型和润滑油膜传热模型引
为探讨采收期与采后处理对杏鲍菇(Pleurotus eryngii)贮藏品质的影响,文中以2种商业采收期(以菌盖直径为45~55 mm、菇体长短为10~15 cm计为小菇,菌盖直径为55~65 mm、菇体长
分析了活塞环基体组织、径向弹力及与汽缸套匹配状况对其减摩耐磨性的影响。结果表明:基体组织以回火索氏体、石墨呈细小均匀分布为佳;活塞环的径向弹力以250~300 N为宜。改进