论文部分内容阅读
单核苷酸多态性(single nucleotide polymorphisms,SNP)是指基因组内特定核苷酸位置上存在着两种不同等位基因,其中最少的一种在群体中的频率不少于1%。单核苷酸多态性因其占人类基因组中多态性的90%以上而受到广泛关注。其特点包括以下几点:首先,位点丰富。SNP分布于整个基因组,据估计,基因组中大约平均每1000bp就会出现1个SNP,从而使其在整个基因组的分布可达300万之多。其次,突变率低,每代每碱基突变率约为2×10-8。尤其是位于编码区的SNP(coding region SNP,cSNP),呈高度稳定性。第三,SNPs位点为单碱基变异,可分析片段短小,更适合PCR扩增及降解DNA的分析。第四,SNPs适于快速、高通量检出。其二态变异,易于判型,有利于发展自动化的筛选或检测技术。第五,SNPs多态性在不同人种和/或群体中的分布有所不同,可用于人类遗传学、疾病相关性及法医学研究。
由于SNPs具有上述特点,不仅很快成为医学、药学、临床诊断学的研究热点,而且在法庭科学生物物证鉴定领域,尤其在解决降解生物检材个体识别方面也引起学者们的极大关注。在法庭科学生物物证鉴定领域中,对于保存条件较好,DNA分子比较完整的生物检材,应用现有的DNA分析技术都能较好的解决。但是,对于保存条件差,DNA分子不完整的降解生物检材尚不能有效解决,这也是当前面临的难题之一。SNP可分析片段短小,更适合降解DNA的分析,因此通过积极开展相关研究,有可能建立一种行之有效的适合这类检材分析的新技术手段。
SNPs位点突变率低,遗传稳定,也是分析人类起源、迁移等比较理想的遗传标记。Sanchez JJ等对索马里、土耳其、丹麦、德国、格陵兰、日本、泰国、台湾和中国大陆9个地区700名无关个体的52个SNPs位点进行分析,通过计算不同种族和民族间的遗传距离,认为亚洲人群中台湾和大陆人群关系最近,其次是二者与泰国人群的关系,再次为与日本人群的关系;研究表明所调查的亚洲人群与其它人群的关系较远,从近到远依次为格陵兰、德国、丹麦、土耳其,最远的为索马里。柯越海等通过对中国各地9988例男性随机样本Y染色体M89,M130和YAP3个单倍型分析,认为Y染色体的证据支持现代中国人起源非洲假说。刘烜等对我国贵州地区布依族、仡佬族、仫佬族、毛南族、壮族5个少数民族10个SNPs构成的Y染色体单倍型分析,认为这5个民族之间遗传关系密切,与国内其他民族有较大的遗传差异,是相对独立的群体。
虽然目前分析SNP的方法有多种,但普遍存在两个方面问题。一是,一些无需专用SNP分析设备的方法,如RFLP、SSCP方法,或者是检测通量低,一次只能检测出单个SNP位点,获得的信息量少,或者是实验操作繁琐,检测过程费时,如SNaPshot,均不适合法庭科学领域的高通量检测需求;二是,另一些操作简单检测通量高的方法均需要借助昂贵的SNP分析专项设备和配套试剂实现,不利于方法本身的推广,例如DHPLC、基因芯片法、MALDI-TOF MS等方法。
为解决法庭科学生物物证鉴定领域降解生物检材的鉴定问题,了解多位点SNPs在中国不同民族人类遗传学、法医学意义并解决现有SNP分析技术的瓶颈问题,本研究结合当前法庭科学实验室普遍采用荧光标记和毛细管电泳分离技术的实际情况,开展了具有普遍适用性的基于毛细管电泳分离技术的荧光标记多位点SNP分型技术研究,旨在建立一种高效率、低成本、快速准确的多位点SNP分型技术。并通过调查常染色体更多SNPs位点在中国不同民族中基因频率调查,以了解SNPs在中国不同民族中的分布状态,在此基础上进一步分析不同民族间的遗传关系,并根据调查结果评估复合扩增21个SNPs在法庭科学中的应用价值。
材料与方法
一、实验材料
1、中国汉、蒙、壮三个民族的血痕样本
辽宁地区汉族健康无关个体血痕样品203份;内蒙古自治区蒙古族健康无关个体血痕样品152份;广西壮族自治区壮族健康无关个体血痕样品184份。
2、灵敏度测定样品:干血滤纸一份,来自本实验室。
3、DnaseI降解实验样品:新鲜血液约2ml,来自本实验室健康自愿者。
4、亲子关系分析样品:为10个待确认的父-子-母三联体共30份干血滤纸,来自本实验室日常实际案例。
5、组织同一性分析样品:为同一个体不同组织的心、肝、脾、肺、肾、肌肉及大脑7份组织,来自本实验室。
6、实际案件中样品:20份血痕、10份肌肉、15枚烟蒂,10份软骨,8份性犯罪混合斑,来自日常案件积累。
二、实验方法
(一)建立荧光标记公用引物片段长度差异SNPs复合扩增技术
1、SNP位点筛选
根据http://www.hapmap.org网站,从1-22号染色体中筛选45个SNPs位点作为备选。
2、SNP位点引物设计、合成
根据荧光标记公用引物和等位基因特异性引物原理,同时在特异性引物序列引入错配的碱基,构建多位点SNPs复合扩增引物体系,应用Primer5.0软件设计引物。SNP特异性引物送上海生工生物公司合成,荧光标记公用引物由宝生物工程(大连)有限公司合成。
3、建立SNPs复合扩增体系
经单位点、分小组、合并组逐级扩大PCR扩增,层层淘汰不合格引物,筛选出可以进行复合扩增的SNPs位点。
4、SNPs复合扩增体系的优化
对起关键作用的引物退火温度、不同位点间引物浓度配比及DNA聚合酶等重要因素进行优化,以完善复合扩增体系。
5、SNPs分型结果的测序验证
针对每个SNP位点重新设计两条测序引物,扩增包含SNP位点在内的序列,精制模板后单向测序,验证SNP分型结果的准确性。
(二)调查3个民族21个SNPs位点基因频率分布及法医学意义评价
采用本研究建立的SNPs复合扩增技术,对我国辽宁地区汉族、内蒙古地区蒙古族和广西地区壮族人群进行基因频率调查,并对3个民族21个SNPs位点等位基因频率分布进行Hardy-Weinberg平衡检验;通过X2检验对3个民族21个SNPs位点的基因分布进行比较分析;通过聚类分析方法分析三个民族间的遗传关系;根据3个民族的调查结果,计算各民族21个SNPs位点的杂合度、多态信息总量、个人识别几率和非父排除率,以评估21个SNPs位点复合扩增的法医学应用价值。
(三)荧光标记公用引物片段长度差异21个SNPs复合扩增的法医学应用
应用本研究建立的复合扩增技术,对DNA最小检出量、组织同一性、21个位点的遗传稳定性以及不同种类生物检材的检验有效性进行了验证实验。为了解本方法对降解生物检材的检测能力,使用Dnasel进行降解实验,并与STR检测结果进行平行比较。用21个SNPs复合扩增技术和AmpF1STRTMSinofiler STRs检测试剂盒,对10个待确认亲子关系的父-母-子三联体案例同时进行亲权鉴定,通过结果比较,探讨本方法在法医学个人识别和亲子鉴定的可靠性和实用性。
结果与讨论
一、荧光标记片段长度差异21个SNPs复合扩增技术的建立
本研究建立的SNPs复合扩增基本原理:每个SNP位点有三条扩增引物,两条上游、一条下游引物,每条引物由特异性序列和公用尾部序列两部分构成。上游引物的3’末端碱基分别与SNP位点的两个等位基因对应,并且在距3’末端的第3位碱基处分别引入一个错配碱基,以提高PCR扩增特异性。公用尾部序列有三种(Uni1,Uni2和Uni3),上游引物中的一条连接公用尾部序列Uni1,另一条连接公用尾部序列Uni2,下游引物连接公用尾部序列Uni3。
公用引物有U1、U2、U3三条,U1和U2分别用荧光标记物HEX(绿色)和6-FAM(蓝色)标记。以利于基因型判定。
本研究复合扩增体系建立采用分阶段分组完成。首先,进行单位点扩增,淘汰不合格位点;其次,分小组复合扩增,每组约5个位点引物,删除不合格位点;再次,合并小组,每组各10-11个SNPs位点,进一步淘汰不合格位点;最后,将所有合格的位点合并成一组,进一步淘汰不合格扩增位点。经过逐级扩大、层层淘汰,最终确定了21个SNPs位点复合扩增体系。在此复合扩增体系中又加入了用于性别鉴定的Amelogenin基因的扩增引物。
本研究建立的SNPs复合扩增技术对21个常染色体SNPs位点和人牙釉质蛋白Amelogenin基因一次性单管扩增,经毛细管电泳后,每个SNPs位点纯合子为单一产物峰,杂合子为两个片段长度相同,呈现蓝、绿两种染色的产物峰,可以正确区分并判定基因型。随机选取6份用本研究方法分型的样品,对每个SNP位点逐一测序验证。结果显示,6份样品荧光标记SNPs复合扩增分型结果与直接测序结果完全一致,证明本方法结果准确、可靠,是一种快速、简单、高效且较为实用的SNPs分型新方法,适用于大样本量的多位点SNPs的同步分型。
二、我国3个民族21个SNPs位点的基因分布
调查结果显示,21个SNPs位点等位基因在辽宁地区汉族、内蒙古地区蒙古族、广西地区壮族3个民族群体中均具有多态性。Hardy-Weinberg平衡检验显示,X2值分别在0.001-1.617、0.002-1.65和0.005-1.53之间,P值均大于0.05,符合Hardy-Weinberg平衡,表明选取的三个群体样本具有代表性。
我国3个民族21个SNPs位点基因频率的比较结果表明:在辽宁汉族和内蒙古蒙古族之间,有2个SNPs位点rs1014440、rs1010870的基因多态性分布呈极显著差异(P≤0.001),1个位点rs1022690有差异(P≤0.05),其余18个SNPs位点的基因分布没有差异(P≥0.05);在辽宁汉族和广西壮族之间,5个SNPs位点rs10003686、rs1022106、rs116187、rs1014440和rs1010870的基因分布有极显著差异(P≤0.001),7个位点rs10005781、rs1024283、rs1001389、rs101570、rs10519137、rs1018427和rs112603(P≤0.05)有差异,其余9个位点没有差异(P≥0.05);在内蒙古蒙古族和广西壮族之间,3个SNPs位点rs1022106、rs116187和rs1014440的基因分布有极显著差异(P≤0.001),3个位点rs10003686、rs1024283和rs1001389有差异(P≤0.05),其余15个位点的基因分布没有差异(P≥0.05),由此可见,三个民族在多个SNPs位点上的等位基因分布具有显著性差异。
本研究采用欧氏距离平方法对3个民族21个SNPs位点共126个等位基因频率的数据进行聚类分析,结果显示,辽宁汉族与内蒙古地区蒙古族之间的欧氏不相似系数最小,为0.348;内蒙古地区蒙古族与广西地区壮族之间的欧氏不相似系数次之,为0.415;辽宁地区汉族与广西地区壮族之间的欧氏不相似系数最大,为0.647。说明辽宁地区汉族与内蒙古地区蒙古族的亲缘关系比辽宁地区汉族与广西地区壮族的亲缘关系更近。
根据21个SNPs位点在辽宁地区汉族、内蒙古地区蒙古族和广西地区壮族的等位基因频率调查结果,计算出各位点在不同民族的多态性信息量(PIC)、杂合度(H)、个人识别几率(Dp)和非父排除率(PE)。
辽宁汉族群体的21个SNPs位点多态信息总量在0.25-0.5之间。杂合度最大的是rs1007469和rs116187位点,均为0.5320,最小的是rs1010870位点,为0.3547;个人识别几率最大的是rs101570位点,为0.6374,最小的是rs1010870位点,为0.5056;非父排除率最大的是rs1003416,为0.1875,最小的是rs1010870位点,为0.1409;21个SNPs位点累积个人识别几率为0.999999997,累积非父排除率为0.984769502。
内蒙古地区蒙古族群体的多态信息总量位于0.25-0.5之间。杂合度最大的是rs10005781,为0.5461,最小的是rs112603位点,为0.3487;个人识别几率最大的是rs101570位点,为0.6269,最小的是rs112603位点,为0.5314;非父排除率最大的是rs10005781和rs1010870,均为0.1874,最小的是rs112603位点,为0.1491;21个SNPs位点累积个人识别几率为0.999999996,累积非父排除率为0.984646。
广西地区壮族群体的多态信息总量均位于0.25-0.5之间。杂合度最大的是rs1010870位点,为0.5272,最小的是rs10003686位点,为0.3587;个人识别几率最大的是rs1018427位点,为0.6419,最小的是rs10003686位点,为0.4998;非父排除率最大的是rs1001389和rs1018427,均为0.1875,最小的是rs10003686位点,为0.1391;21个SNPs位点累积个人识别几率为0.999999995,累积非父排除率为0.98236771。
以上数据表明,本研究选择的21个SNPs位点在中国辽宁地区汉族、内蒙古地区蒙古族、广西地区壮族3个民族中具有较好的多态性分布,联合使用这21个SNPs位点遗传标记的累积个人识别几率和累积非父排除率均分别达到99.999999%和98%以上。因此认为,应用本研究建立的荧光标记公用引物片段长度差异复合扩增体系,进行21个SNPs遗传标记的基因分型,在法医学个人识别和亲子鉴定中具有较高的系统效能和应用价值。
三、荧光标记SNPs复合扩增技术的法医学应用研究
本研究对所建立的方法,进行了在法庭科学领域应用前的有效性验证实验,包括灵敏度、组织同一性、遗传稳定性及不同种类生物性检材的检验。同时,为了解此方法对降解生物检材的分析能力,利用DnaseI进行降解实验,并与STR复合扩增方法进行了平行比较。
实验结果表明,21个SNPs位点的复合扩增体系检测的最低检测限为125pg;来自同一个体心、肝、脾、肺、肾、肌肉、大脑7种不同组织的21个SNPs位点及Amelogenin位点分型一致,证明本研究建立的方法比较灵敏,具有稳定性。
对63份日常实际案件中血痕、肌肉、烟蒂、软骨及混合斑检材进行分析,均获得满意的分型结果。表明本研究方法对常见生物检材同样具有良好的适用性。
将本研究建立的方法应用于两起刑事案件,获得的同一比对结果得到了AmpF1STRTM Sinofiler试剂盒STR分型结果的进一步支持。证明本研究建立的方法可以进行生物性检材的同一比对。
本研究对经DnaseI瞬时和5分钟降解的DNA样品进行分析,并使用AmpF1STRTMSinofiler试剂盒和AmpF1STRTM MiniFilerTM试剂盒进行平行比较,结果表明,应用本研究建立的21个SNPs位点的复合扩增体系比常规STR试剂盒及MiniSTR试剂盒具有更高的检测成功率。
对10个待确认亲子关系的二代三联体的分析结果显示:21个SNPs位点均未发现变异,10个案例均未排除生物学亲子关系。同时采用AmpF1STRTM Sinofiler试剂盒检验15个STR位点作为对照,所得结论与SNPs检测结果一致。说明本研究建立的21个SNPs位点复合扩增技术可以应用于亲子鉴定。
综上所述,本研究建立的荧光标记片段长度差异21个SNPs位点复合扩增技术,可以应用于人类遗传学、疾病相关性研究以及法医学个人识别和亲子鉴定。
结论
1、本研究建立的荧光标记公用引物片段长度差异SNPs复合扩增技术,结果准确、可靠,是一种简单、快速、有效且实用的又一种SNP多态性分析方法,可用于21个SNPs基因的同步分型。
2、我国辽宁地区汉族、内蒙古蒙古族和广西壮族21个SNPs位点的等位基因分布具有多态性。抽样调查符合Hardy-Weinberg平衡。
3、21个SNPs位点在三个民族中有多个位点的等位基因频率具有显著性差异(P≤0.01)。辽宁地区汉族与内蒙古地区蒙古族的亲缘关系更为接近,与广西地区壮族的亲缘关系较远。
4、荧光标记公用引物片段长度差异复合扩增21个SNPs分型技术在法医学鉴定中具有较高的系统效能和实用价值。