论文部分内容阅读
背景
智力障碍(Intellectualdisability,ID)是一种复杂的神经发育性疾病,表现为智力和适应能力低下,在世界人口中的发生率为1%,致病因素主要有遗传、感染、营养不良等。遗传作为其发病的重要致病因素,并已从家系分析、高通量测序数据分析中得到证实。国内外的遗传研究重点是筛选出相关疾病的致病基因以及遗传规律的分析。新生突变(denovomutations,DNMs)在严重散发ID疾病病因中扮演重要作用。DNMs是新致病基因的一个重要的来源并且为ID的遗传全景提供更深见解。通过筛选更多群体和家系研究中重复有害的DNMs,发现ID的有害位点与相关基因的数目也更多,比如DYNC1H1,CTNNB1,KCNQ3,DLG4和PPM1D。然而,现在仍有很大一部分的患者病因未明,提示疾病相关基因仍有许多未知,此外对于ID致病基因的相关遗传发病机制以及分子特征等方面仍然需要进一步探索。
目的
以DNMs为基础筛选ID致病基因并分析其相关遗传特征及规律。
方法
本研究收集了1,047个ID核心家系(未患病的父母和患病的子代)与951个正常的核心家系中全基因组测序(Whole-genomesequencing,WGS)或全外显子测序(Whole-exomesequencing,WES)数据,一共39,807个DNMs。经过质量控制、突变注释,筛选过滤后聚焦于编码区和剪接位点且最小等位频率小于0.001的新生突变,其中患者有1,392个和对照有702个。基于四种背景新生突变率(denovorate,DNMR),利用TADA(TransmissionAnddenovoAssociation)贝叶斯模型评估收集到的DNMs数据集的致病性,得到ID的已知和候选致病基因。此外,通过对高置信度ID致病基因的保守性和有害性评估,功能性富集,脑区特异性表达以及加权基因共表达网络分析等进一步了解ID的遗传特征。
结果
从1,027个ID核心家系和951正常的核心家系中获得的39,807个DNMs,基于四种背景突变率,验证了63个高置信度(q值<0.1)的ID致病基因。生物信息学注释显示这63个ID基因在FMRP靶向数据集与CHD8的靶向数据集中的富集比随机预期更高,而且这些基因在基因功能变异中具有严格的进化保守性。另外,利用大脑时空富集分析发现,这些ID致病基因更趋向于胎儿早期至胎儿中后期的大脑皮质层表达。尤其是在加权基因共表达网络分析中ID致病基因在人类大脑发育中主要富集在两个生物学模块(M1和M2)中。通过功能注释发现M1特征性在染色质修饰和转录调控中富集,M2在突触功能中富集,暗示了这两个模块具有病因学差异。此外,收集了741个ID已知致病基因,其中q值<0.1的63个基因中有12个强候选致病基因不在已知基因中,包括TCF7L2,KDM2B,PPP1CB,TNPO2,USP7,ABCC3,CACNA1A,CEP85L,CSNK2A1,FBXO11,PPP2CA,SLC6A1。也注意到12个高置信度的ID致病基因与已知ID致病基因(q值<0.3)之间的分子相互作用比随机的更为紧密。
结论
1、通过从生物学注释,进化保守性,基因共表达和蛋白网络互作等方面提供多种功能相关分析的证据,不仅支持了这63个q值<0.1的高置信度基因在ID病因学中的重要作用;也为以后发现新ID致病基因提供新的方法和思路。
2、利用大脑特异性网络富集发现ID基因优先表达于大脑皮质中,它们也为ID发病机制中涉及的突触功能、染色质修饰和转录调控提供了共同的分子基础。
3、所鉴定的新基因以及发现的功能通路有利于对ID遗传结构的理解和ID致病机制的深入研究,有助于ID的疾病诊断,风险评估和对症治疗。
智力障碍(Intellectualdisability,ID)是一种复杂的神经发育性疾病,表现为智力和适应能力低下,在世界人口中的发生率为1%,致病因素主要有遗传、感染、营养不良等。遗传作为其发病的重要致病因素,并已从家系分析、高通量测序数据分析中得到证实。国内外的遗传研究重点是筛选出相关疾病的致病基因以及遗传规律的分析。新生突变(denovomutations,DNMs)在严重散发ID疾病病因中扮演重要作用。DNMs是新致病基因的一个重要的来源并且为ID的遗传全景提供更深见解。通过筛选更多群体和家系研究中重复有害的DNMs,发现ID的有害位点与相关基因的数目也更多,比如DYNC1H1,CTNNB1,KCNQ3,DLG4和PPM1D。然而,现在仍有很大一部分的患者病因未明,提示疾病相关基因仍有许多未知,此外对于ID致病基因的相关遗传发病机制以及分子特征等方面仍然需要进一步探索。
目的
以DNMs为基础筛选ID致病基因并分析其相关遗传特征及规律。
方法
本研究收集了1,047个ID核心家系(未患病的父母和患病的子代)与951个正常的核心家系中全基因组测序(Whole-genomesequencing,WGS)或全外显子测序(Whole-exomesequencing,WES)数据,一共39,807个DNMs。经过质量控制、突变注释,筛选过滤后聚焦于编码区和剪接位点且最小等位频率小于0.001的新生突变,其中患者有1,392个和对照有702个。基于四种背景新生突变率(denovorate,DNMR),利用TADA(TransmissionAnddenovoAssociation)贝叶斯模型评估收集到的DNMs数据集的致病性,得到ID的已知和候选致病基因。此外,通过对高置信度ID致病基因的保守性和有害性评估,功能性富集,脑区特异性表达以及加权基因共表达网络分析等进一步了解ID的遗传特征。
结果
从1,027个ID核心家系和951正常的核心家系中获得的39,807个DNMs,基于四种背景突变率,验证了63个高置信度(q值<0.1)的ID致病基因。生物信息学注释显示这63个ID基因在FMRP靶向数据集与CHD8的靶向数据集中的富集比随机预期更高,而且这些基因在基因功能变异中具有严格的进化保守性。另外,利用大脑时空富集分析发现,这些ID致病基因更趋向于胎儿早期至胎儿中后期的大脑皮质层表达。尤其是在加权基因共表达网络分析中ID致病基因在人类大脑发育中主要富集在两个生物学模块(M1和M2)中。通过功能注释发现M1特征性在染色质修饰和转录调控中富集,M2在突触功能中富集,暗示了这两个模块具有病因学差异。此外,收集了741个ID已知致病基因,其中q值<0.1的63个基因中有12个强候选致病基因不在已知基因中,包括TCF7L2,KDM2B,PPP1CB,TNPO2,USP7,ABCC3,CACNA1A,CEP85L,CSNK2A1,FBXO11,PPP2CA,SLC6A1。也注意到12个高置信度的ID致病基因与已知ID致病基因(q值<0.3)之间的分子相互作用比随机的更为紧密。
结论
1、通过从生物学注释,进化保守性,基因共表达和蛋白网络互作等方面提供多种功能相关分析的证据,不仅支持了这63个q值<0.1的高置信度基因在ID病因学中的重要作用;也为以后发现新ID致病基因提供新的方法和思路。
2、利用大脑特异性网络富集发现ID基因优先表达于大脑皮质中,它们也为ID发病机制中涉及的突触功能、染色质修饰和转录调控提供了共同的分子基础。
3、所鉴定的新基因以及发现的功能通路有利于对ID遗传结构的理解和ID致病机制的深入研究,有助于ID的疾病诊断,风险评估和对症治疗。