论文部分内容阅读
单核苷酸多态性(Single Nucleotide Polymorphisms,SNP)是指在基因组上由单个核苷酸(A,T,C,G)变异所引起的多态性,它在人类基因组中分布广泛,携带着DNA的遗传信息,是遗传变异最基本的单位。多项研究表明,很多常见的疾病,如糖尿病,心肌梗死和老年痴呆症等都与SNP有关。因此,研究不同的SNP或SNP组合与疾病之间的关联关系,能够帮助人们进一步探究疾病的内在机理,辅助医生对病人进行提前诊断和精准治疗。本文从SNP数据出发,依次对疾病相关SNP致病因素检测算法、SNP致病因素与疾病的关联关系模型建立方法进行深入研究,建立了SNP致病因素与疾病的关联关系模型,将两者之间的关系进行了合理量化,并将该模型应用到了疾病的辅助诊断当中。具体来说,本文所做的主要工作和取得的成果如下:1.在现有SNP致病因素检测算法性能比较阶段,提出了一种以检测结果完整性和准确性为主要目标的算法性能评价测度——检测能力,对多种已有的SNP致病因素检测算法进行了相应的性能比较。实验结果表明,利用该评价测度能够从现有众多算法中选择出检测结果相对完整和准确的SNP致病因素检测算法。2.在SNP致病因素与疾病关联关系建模阶段,提出了DTEM算法,建立了SNP致病因素与疾病之间的初始化关联关系模型。针对其中N个SNP致病因素之间相互交叉对结果产生影响的问题,引入绝对划分的概念,提出了AD-DTEM算法对初始化关联关系模型进行优化。实验结果表明通过DTEM算法建立的SNP致病因素与疾病的关联关系模型能够反映出SNP对疾病影响程度的大致趋势,通过改进的AD-DTEM算法建立的SNP致病因素与疾病的关联关系模型具有更高的准确性,能够更真实地反映SNP对疾病的影响程度。3.在研究应用阶段,将前一阶段所建立SNP致病因素与疾病关联关系模型应用到疾病的辅助诊断工作中,在具体诊断过程中,本文提出了用于对新来未知样本进行诊断的三种疾病诊断策略:简单诊断策略、基于代价敏感的诊断策略、基于概率的诊断策略。针对每种诊断策略,分别设计和完成了独立诊断实验和联合诊断实验。实验结果表明相较于传统的基于简单分类的疾病诊断方法,本文所提出的基于SNP致病因素与疾病的关联关系模型进行疾病诊断的方法能够取得较高的诊断正确率。