基因模式的PICA获取及基于Boosting的模式分类

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:A136C316
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片是获取大规模基因表达数据的崭新技术,运用这种技术可以获得并分析机体组织中成千上万个基因的表达水平及其与疾病的关系。但是,机体组织所具有的部分体积效应,使得对基因微阵列数据的直接处理将造成所提取特征不是真正的生物基因特征本身,严重降低基因特征测量的灵敏度和指向性。因此,本文提出用部分独立分量分析方法代替传统的生物医学方法进行基因的部分体积修正从而获得真正感兴趣的微阵列数据。该方法不但降低了生物实验的成本,而且易于操作实现,具有很强的应用价值。同时,根据基因微阵列数据的特点:极少样本超高维,本文引入了一个新的统计机器学习算法Boosting。在对Boosting算法进行详细分析并设计了一种新的证明其收敛性的方法后,从算法的不稳健性出发,对Boosting算法中多个弱分类器集成规则进行了改进,提出了一种稳健的Boosting学习算法。经过对公开的测试数据集和真实的基因微阵列数据大量实验,证明了用部分独立分量分析方法获取基因微阵列数据及Boosting改进算法进行基因模式分类的可行性和有效性,最终也完成了基因模式的识别任务。
其他文献
OLAP是一种建立在多维数据模型基础上的数据分析技术,它使分析人员能够从多角度对数据进行快速、一致、交互的存取,获得所有可能的、多种多样的多维信息视图,从而发掘出数据
随着因特网的迅猛发展,网络已成为信息交换的主要手段。最近几年一些网络新业务的不断兴起,如电子商务、移动支付等,这些都对网络安全提出了较高的要求;而黑客对网络的攻击从未停
随着软件规模和复杂性的不断增加,软件设计的核心已不再是传统的“算法+数据结构=程序”的计算设计模式,取而代之的是系统的总体结构设计和规范。而软件体系结构的研究正是为了
该文首先介绍了嵌入式系统,嵌入式处理器的发展与应用,嵌入式操作系统,嵌入式系统的发展,国内移动终端的发展近况以及该文的理论与实践背景;接着阐述了系统的总体结构,概略介
学位
目前,农用植保无人机成为研究热点,针对该领域对无人机飞行性能的要求,即飞行平稳性、反应及时性以及飞控系统的兼容性,本文对六旋翼无人机的飞行控制算法进行了研究。首先,
支持向量机对于小数据集的训练预测效果比较好,而且支持向量机适合解决线性不可分的情况.因此用支持向量机进行蛋白质二级结构预测是一个比较有发展的方法.蛋白质二级结构预
随着社会的发展和进步,产生了越来越多的数据,尤其是近几年来Internet的迅速普及和广泛应用,数据呈爆炸式增长.传统的存储系统已经不能满足企业对存储系统高可靠性,可扩展性
20世纪90年代以来,随着互联网以及各项相关技术的日趋成熟,电子商务在社会经济领域得到了广泛的应用.在发达国家,电子商务发展迅速,电子商务推动了商业、贸易、营销、金融、
操作系统安全是计算机系统安全的基础,要保障计算机系统的安全,首先需要一个安全的操作系统,目前流行的Linux操作系统的安全级别比较低,无法满足信息安全的需要。本论文的研究目