论文部分内容阅读
随着下一代测序技术的出现,复杂性疾病与突变之间的关联性研究受到更多关注。其中常见变异的关联检测方法得到较好的发展,而最近几年的研究表明稀疏变异对单基因疾病和常见疾病有较大的作用。与常见变异的关联研究相比,稀疏变异具有更低的次等位基因频率。针对常见变异的关联检测方法,在大部分情形下都不能很好的用于稀疏变异的关联研究。因此需要研究专门针对稀疏变异的关联检测方法。本文主要是对疾病与稀疏变异的关联分析方法进行研究,主要包括下面的两点工作:(1)本文针对这些方法的鲁棒性问题提出了一种基于多种检测融合的稀疏变异关联方法。从已经存在的稀疏变异或常见变异的检测方法中选出几种进行融合。选择的标准是选择那些在某一种或几种情况下执行较好的检测。然后计算这些方法相应的P值,再根据这些P值对进行检测的结果进行打分,最后再对得分进行一次假设检测。通过这种策略可以避免由于单个检测对于某种数据集敏感而导致大的强度损失,且在各种数据集上都能得到一个不错的检测强度。主要通过在5个仿真数据集上进行实验来与以前的大部分方法进行比较,实验结果显示本文提出的融合多种检测方法提高了检测稀疏变异关联性的稳定性。(2)通过把分组的思想融入到加权和的方法,可以得到一种新的检测方法。首先根据次等位基因频率对变异进行分组,然后再对分组后的稀疏变异进行加权求和。通过这种策略可以避免一些由于存在常见变异而导致的强度损失。在一个独立的稀疏变异数据集上进行实验,结果表明该方法在该数据集上能达到最好的检测强度。