SNP定位的一种降维及变量选择方法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lisky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类拥有46条染色体,每条染色体由载有人类遗传信息的DNA和蛋白质构成。由于DNA是双螺旋结构,且每个DNA又由4种不同的碱基构成,而这些碱基的数目众多,称那些出现变异的碱基对为单核苷酸多态性(SNP),人类大约拥有30万的SNP标记,但是在现实研究中,可以用到的样本人数往往只有百人左右,而真正的致病的SNP也只有数个,如何从数万到几十万个SNPs中选出真正的致病的位点,是一个典型的满足稀疏性的高维数据变量选择的问题。   本文主要研究高维数据的降维问题,即“小n大P”问题,传统的变量选择方法往往都是适用于“大n小P”的情况,对于“小n大P”问题往往不能使用。这就需要先进行降维处理,然后才能使用传统的选择方法。本文中我们提出一种新的变量筛选方法-动态分割法,同时介绍两种改进的BIC准则:EBIC及EDC准则,并将其运用到变量选择中。   引入衡量变量选择优良性的准则FDR和PSR,针对所提出的算法进行数据模拟,比较算法的优劣,同时比较EBIC、EDC、BIC准则选择的优劣。
其他文献
混沌动力学是一门新兴的学科,混沌本身是不稳定的,对初值非常敏感。混沌吸引子的存在性由两个条件确定:一是有吸引域,保证吸引子的存在,二是在吸引子上存在混沌行为。本文围绕非线
本文主要研究了两个问题:图的最大亏格以及三类图的1-因子计数.   本文第一部分是关于图的最大亏格的综述.图的最大亏格问题一直以来都是图嵌入理论中的一个重要问题,本文综
本文讨论了一个周期边界条件下的Dirac算子的谱问题,记其中p(x),r(x)∈C[O,π],λ为复参数。   首先研究了特征值的秩与整函数ω(λ)的零点重数一致的问题,进而借助于一个微分恒
变分不等式问题作为描述平衡问题的重要工具,在网络经济,交通规划,对策论,工程管理,以及区域科学等领域有着广泛的应用.目前已提出多种迭代算法求解不同类型的变分不等式问题
本研究针对几乎不可压缩弹性问题,设计Uzawa型有限元方法,克服了其中存在的locking现象。对几乎不可压缩弹性材料,当Lamd系数λ→+∞时,使用低阶协调有限元就会出现有限元近似解
本文研究了Wilson元Neumann-Neumann和BPS预处理方法解椭圆问题.   在第一章,对于带间断系数的二阶椭圆问题,我们提出了Wilson元的Neumann-Neumann型的Schwarz预处理方法
控制系统的稳定性分析是系统分析的重要组成部分,Bezout矩阵是解决线性系统稳定性问题的一个有力工具.近年来随着控制理论的发展,Bezout矩阵及其各种推广在现代线性代数中有着越
对于图G(V,E),给定一个正整数k,一个正常k边染色是一个映射c:E→{1.2……k},对于任意两条相互关联的边e1,e2∈(G),有c(e1)≠c(e2)。一个正常k全染色是一个映射c:V∪E→{1.2……k}
图像分割是图像处理的一个重要过程,是进一步进行图像分析的基础。近年来,其研究受到国内外学者的广泛关注,至今已经提出了大量的算法。几何活动轮廓模型是其中最成功的图像
本文主要研究加权g-期望与倒向重随机微分方程的若干问题.  第一章介绍了研究背景、研究现状及主要研究内容,详细介绍了g-期望的基本概念及相关性质,为后文的研究工作提供了