基于小波分析的基因芯片数据的特征提取

被引量 : 0次 | 上传用户:manstation
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术是基因组信息学研究的基础,在基因水平上研究癌症提供了支持。基因芯片是一种有广泛应用前景的分子生物学技术。在基因芯片的应用过程中会产生大量数据,通过处理、分析、提取等步骤,可以得到基因芯片中有价值的生物学信息。特征是保持基因芯片数据真实性的量度,并且只含尽可能少的冗余信息。基因芯片数据的高维性和小样本问题也需要进行降维和特征提取。基因芯片数据的模式分类问题,通过特征提取可以提高正确分类率。本文分别提取小波分解的低频系数和高频系数表征基因芯片数据的特征,用k-fold交叉验证的方法划分基因芯片数据训练样本集和测试样本集,评估不同小波函数多尺度分解以后的分类效果。特征提取和分类是模式识别中的关键问题,本文着重研究基因芯片数据的特征提取和分类问题。本文结合小波分析理论和支持向量机理论,构造分类器模型,将前列腺癌基因芯片数据分成癌症和正常两种。本文提取小波低频系数表征原始数据并送入支持向量机分类器分类,实验证明:提取db2小波3层分解下的低频系数,5-折交叉验证,分类器分类后正确分类率是92.46%。Haar小波的正确率是92.88%。可见提取不同小波低频系数,分类效果相差不大。本文提取小波高频系数表征原始数据的特征,并通过实验对比小波高频系数和低频系数特征提取对分类器性能的影响。其中db4小波4层分解提取高频系数,送入分类器分类后,5折交叉验证,得到的正确分类率为92.39%。haar小波4层分解提取低频系数,送入分类器分类后,5折交叉验证,得到的正确分类率为92.94%。小波低频系数特征提取分类效果总体上好于高频系数,分类器性能稳定。
其他文献
唐代离婚需要经过必要程序,双方同意、制作手书、上报官府是和离和七出离婚都要经过的程序,朝廷批准是官员离婚必须经过的特殊程序,官方裁决是出现离婚纠纷时要经过的程序。
发掘“天赋”潜能 注重素质培养──口头语言表达能力训练刍议天津三中张永泉语文,本是一门实践性很强的工具学科,然而,在单纯应试教育的影响下,轻学法引导,轻能力培养的现象十分
针对高炉富氧喷吹煤气的新工艺,进行了热平衡和物料平衡计算。通过分析研究得到:当富氧率为10%,喷吹600m3tFe时,与唐钢1#高炉相比,新工艺的焦比可降低约40%左右。同时炉内还
<正>幼儿教育作为启蒙教育,有其特殊性。随着我国幼儿教育事业的不断发展,对幼儿教师的专业素养提出了更高的要求。一名优秀的幼儿教育者,不仅要熟练地掌握幼儿教育专业知识
海洋多次波是海洋地震资料处理中最难去除的噪声,目前时空域预测反褶积、SRME、高精度拉冬切除等方法均能有效衰减部分多次波,但对于强反射界面(如硬海底,海底以下高速层等)
阅读教学在高中英语教学中所占权重大,受到广泛的重视。然而实际的英语阅读教学效果并不理想,学生的语篇理解存在困难,往往不能完全抓住文章的主要信息点,摘要的写作内容也不
提高融资风险管理水平是缓解融资难问题的重要环节。课题组在对宁夏中小企业融资风险及融资风险管理现状调查研究的基础上提出了解决对策。
<正> 对焦化厂蒸氨塔的设计计算,以前一直套用苏联柯洛布恰斯基等的错误方法,后来,国内不少人从理论和实践两方面对该法的错误作了纠正,形成了我国自已的计算方法。但是还不
首先利用Nelson Siegel参数估计模型求出上交所债券市场债券价格隐含的利率期限结构,发现债券市场隐含的利率期限结构呈现两种典型形状:1996年前为逆向的利率期限结构,1996年
随着全球化脚步的加快,各国之间的文化交流越发频繁,人们越来越容易从网络上接触到文学作品,网络小说成为一种新兴阅读方式,而网络小说的翻译研究历史并不长。本文通过对翻译