基于统计检验理论的拷贝数变异检测方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:z88981414
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着第二代测序技术的逐渐成熟与广泛应用,基因检测技术得到了快速发展,这对人类疾病研究有着极大促进作用。其中,拷贝数变异是基因组结构变异的重要组成部分,其主要表现为亚显微水平的缺失和扩增。目前已证实该变异类型与人类癌症以及遗传疾病等有密切联系,准确检测拷贝数变异对于癌症机理及靶向药物挖掘具有重要的意义。现有拷贝数变异检测方法大多数在测序数据低覆盖度情况下准确度有限,为此本文提出一种基于统计检验理论的拷贝数变异检测算法,其主要有如下三个方面工作研究:第一方面,本文在样本预处理环节提出一种新的固定步长部分重叠滑动窗口,该方法是对传统非重叠滑动窗方法的一种改进。部分重叠滑动窗口相对于以单个碱基RD值为单位的输入样本,其数据量有极大降低,有效的减少了计算机资源的消耗。同时,由于滑动窗口之间存在重叠部分,这使得单位长度的碱基序列其窗口数据量增多。也就是说滑动窗口的异常程度应该由一起重叠的所有窗口决定,这将减少异常信号对单个窗口的影响。相对于传统非重叠滑动窗而言,通过使用部分重叠固定滑动划分方式有效地增加了单位距离的数据样本量,在保证准确率的情况下极大的降低噪声信号误差对检测结果的影响。第二方面,本文提出一种基于统计检验的拷贝数变异检测方法,本检测方法是将假设检验理论运用到拷贝数变异检测中,将每个滑动窗口的RD均值作为假设样本,通过分析统计量分布来判断在一定概率情况下该样本对原假设是否合理,从而决定是否为拷贝数变异区间。针对统计检验算法在检测过程中存在检测精度较低的问题,本文采取了二次统计迭代检验的方法,首先将第一次统计检验所找出的拷贝数变异区域去除,筛选出未变异正常的拷贝数区段,重新计算出正常区段的拷贝数均值和方差来代替整段拷贝数的均值和方差进行统计检验建模。该方法很好的降低了拷贝数变异区域对假设检验模型的误差影响,从而有效的提高了拷贝数变异检测的敏感度。第三方面,本文在算法检测过程中,考虑到相邻滑动窗位置相关性问题,提出了一种通过比较变异区域相邻位置滑动窗的RD值来收缩变异区域的方法,解决了拷贝数变异边缘区域的较小正常区域误差对实验结果的影响问题,从而提高了拷贝数变异检测的准确度。
其他文献
学位
学位
学位
学位
随着新时代国民经济的发展以及人们生活水平的提高,人们对于居住的房屋外观有了新的追求,不仅对房屋、楼顶的涂刷有一定的要求,在进行吊顶以及顶棚的装修方面也有相应的审美要求。这就要求室内装修作业人员在传统的施工工艺中结合新兴元素,顺应时代发展,既要满足建筑相关的硬性标准,又要增添人文情怀。因此,文章结合生活经验与专业知识,对房屋室内吊顶以及顶棚装修施工工艺进行分析和总结。
学位
学位
学位
学位
学位