论文部分内容阅读
目的:Y-STR(Y-chromosome short tandem repeats,Y-STR)具有男性特有、父系遗传的特点,在性侵案件调查、父系亲权鉴定、失踪人员男性家系推断等方面具有特殊的应用价值。目前常规应用的Y-STR遗传标记在同一个父系家族中大多表现一致的单倍型,有利于认定同一父系,但无法区分同一父系家族中的不同男性个体。近年来研究发现Y染色体上存在快速突变Y-STR(rapidly mutating Y-STR,RM Y-STR)其突变率大于1×10-2,较普通Y-STR具有更高的遗传多态性,故在男性亲缘个体识别方面可能具有较高应用价值。为1深入研究RM Y-STR的序列结构及遗传特征,本研究采用毛细管电泳(capillary electrophoresis,CE)分型方法和下一代测序技术(next generation sequencing,NGS)探究河北汉族人群中RM Y-STR基因座的基因序列特征、遗传多态性和突变率,评估其法医学应用价值,为RM Y-STR基因座的法医学应用提供基础数据,为法医学解决男性亲缘个体识别提供新的技术方案。方法:1.采用MicroreaderTMRM-Y ID System(包含15个RM Y-STR基因座)对河北汉族475个无关个体和500对父-子样本进行CE检测,对河北汉族人群RM Y-STR基因座进行遗传多态性分析和突变率分析。2.采用本实验室构建的NGS-RM Y-STR分型体系(包含19个RM Y-STR基因座)对44个父-子对样本和2800M DNA进行文库构建、文库质控和上机测序,使用wintermute软件修改版和STRait Razor V3.0软件对NGS下机数据fastq文件进行分析,获得RM Y-STR基因座的序列特征,比较该系统分型结果和CE结果,比较父-子对间分型差异。结果:1.RM Y-STR基因座遗传多态性分析475个河北汉族无关男性个体15个RM Y-STR基因座共计检测出676个等位基因,各基因座检出的等位基因数目8(DYS630)~239(DYF399S1)不等。475个无关男性中共检出474个唯一单倍型,15个RM Y-STR基因座的单倍型多态性高达0.999991,个体识别度99.79%。33个男性个体中还发现52个多等位基因现象,涉及10个基因座。2.RM Y-STR基因座基因序列分析2.1参与测序的所有文库均达到质控标准。DYS547、DYS526 II、DYS526I、DYS713基因座因存在非特异产物,在后续NGS数据分析中去除。DYS449基因座的等位基因判读阈值设置为19.0%,其余基因座等位基因判读阈值为11.0%。64个样本及3个2800M的平均Do C为78643±42879×(mean±SD),基因座总体平均Do C为4797±5215×(mean±SD),所有基因座的平均Allele%、Stutter%和Other%占比分别为84%、11%、4%。2.2 NGS-RM Y-STR分型体系除DYS526I存在非特异扩增外,其他基因座均表现良好的特2异性;13个与MicroreaderTMRM-Y ID System共同的基因座,其NGS分型结果与CE分型结果相同;阳性标准品2800M的6次重复测序结果一致,表明该体系有较好特异性、一致性和重复性。2.3 64个样本的NGS结果共检出1498个等位基因,较CE结果多检出74个同等位基因和128个基于长度多态性的等位基因。NGS分型方法检出20次异常的多等位基因分型,涉及5个基因座,NGS相较于CE可以明确多等位基因间的序列差异,还能够通过比较测序深度推断多等位基因的变异来源。3.RM Y-STR基因座的突变率调查对500对父-子对的15个RM Y-STR基因座进行突变率调查,在120对父-子中发现了138次突变事件,包括134次一步突变,3次两步突变和1次三步突变,可区分24.0%的父子,各基因座突变率在2.00×10-3~4.20×10-2之间,平均突变率为1.62×10-2,Kruskal-Wallis检验显示突变与父亲生育年龄有关。NGS方法在64个样本包含的44对父-子中检测到11次突变事件,NGS检测方法锁定了突变的位置和具体的序列,提供了更多有价值的信息。结论:本研究应用NGS技术和CE方法对河北汉族人群RM Y-STR基因座进行序列及遗传特征分析,调查发现15个RM Y-STRs在河北汉族人群中的单倍型多样性达0.999991,具有较高的遗传多态性;其平均突变率为1.62×10-2,能区分24%父子对;本实验室构建的RM Y-STR分型体系具有较好的稳定性、一致性和重复性,获得RM Y-STRs的序列特征,检测到更多的同等位基因,明确了突变位置及序列,并且根据测序深度推断异常等位基因的变异来源,为解决男性亲缘个体识别提供了具有应用价值的遗传标记和技术方法。