论文部分内容阅读
骨质疏松症(Osteoporosis)是用骨密度(Bone mineral density,BMD)定义、以骨量减少、骨组织微结构退化为特点,导致骨脆性和骨折易感性增加的骨骼疾病,骨密度的遗传力为50%-85%。全基因组关联研究(Genome-wide association study,GWAS)是鉴定复杂疾病易感基因的有效方法。GWAS已发现大量与骨质疏松症关联的位点和单核苷酸多态性(Single nucleotide polymorphism,SNPs),阐述这些关联位点和SNP在骨质疏松症易感性中的功能和机制是后GWAS时代的主要挑战。LncRNA(Long non-coding RNA,LncRNA)在疾病的发展过程中发挥重要的生物学功能,而与骨质疏松症相关的lncRNA只有少数被鉴定出来。本研究的目的是研究骨质疏松症GWAS关联位点1p36.12的功能机制,挖掘骨质疏松症GWAS关联位点的lncRNA,并进行计算分析和功能预测。一、骨质疏松症GWAS关联位点1p36.12的功能研究全基因组连锁和关联研究鉴定1p36.12是一个重要的骨质疏松症关联位点。1p36.12位点包括 GWAS SNPs rs7521902、rs7524102、rs34920465、rs6426749和WNT4、ZBTB40和lncRNA基因ZBTB40-IT1。WNT4在骨代谢中的功能已有报道,而ZBTB40和ZBTB40-IT1在骨代谢中的功能尚不清楚。计算分析表明,rs7521902和rs34920465可差异结合转录因子JUN::FOS,rs7524102可差异结合转录因子TCF7L2,rs6426749可差异结合转录因子CREB1。Rs7521902和 rs7524102 分别是WNT4 和 ZBTB40的eQTL(Expression quantitative trait loci,eQTL)。SNPs rs7521902和rs7524102是增强子SNPs。双荧光素酶实验表明rs7521902等位基因不能差异结合转录因子JUN::FOS。Rs7524102-A等位基因能结合转录因子TCF7L2,增加增强子活性,促进ZBTB40-IT1和ZBTB40的表达;rs34920465-G和rs6426749-C等位基因分别结合转录因子JUN::FOS和CREB1,增加ZBTB40-IT1的表达。在人骨肉瘤细胞株U-2OS和人成骨细胞株hFOB1.19细胞中,lncRNAZBTB40-IT1显著抑制骨生成相关基因WNT4、RUNX2、OSX、COL1A1和ALP的表达,抑制骨生成;同时降低破骨生成相关基因OPG的表达,增加破骨生成相关基因RANKL的表达,RANKL/OPG比率大于1,促进破骨。LncRNAZBTB40-IT1不影响ZBTB40的表达。ZBTB40的功能与ZBT40-IT1相反。在U-2OS细胞中,ZBTB40能显著增加WNT4、RUNX2、OSX、COL1A1和ALP的表达,有利于骨生成;同时升高OPG的表达,减少RANKL的表达,RANKL/OPG 比率小于1,阻碍破骨。ZBTB40能抑制ZBTB40-IT1的表达。甲状旁腺素(Parathyroid hormone,PTH)能显著降低lncRNA ZBTB40-IT1的表达,升高WNT4的表达,但对ZBTB40的表达没有影响。二、骨质疏松症GWAS关联位点lncRNA的挖掘和计算分析截至2018年12月,共报道骨质疏松症GWAS SNPs 524个(P<5×10-8)。共有350个lncRNA分布在 GWAS 关联位点,其中 antisense lncRNA 153 个,lincRNA(Long intergenic noncoding RNA,lincRNA)143个,pseudogene 38个。通过Annolnc网站进行lncRNA的保守性分析,在灵长类动物、哺乳动物、脊椎动物中保守元件数目均大于20的lncRNA有43个。通过iLoc-LncRNA网站进行lncRNA的亚细胞定位分析,54.86%的lncRNA定位于细胞质,23.14%的lncRNA定位于细胞核,外泌体和核糖体分别占10.29%和11.71%。运用Annolnc网站进行lncRNA-蛋白质互作分析,89个lncRNA与蛋白质存在互作,交联免疫沉淀反应(Crosslinking-immunprecipitation,CLIP)data 结果显示 117 个 lncRNA 较多地与 FMR1、PTBP1、CSTF2、HNRNPU、ELAVL1等蛋白有互作。通过LncRNASNP网站进行lncRNA-miRNA互作分析,鉴定出已知与骨代谢密切相关的 miRNA,如 hsa-miR-214、hsa-miR-107、hsa-miR-103a、hsa-miR-34a-3p、hsa-miR-19a-3p和 hsa-miR-125a-3p 等。三、受PTH调控lncRNA的鉴定和计算分析在PTH处理6 h的Saos-2细胞中利用RNA-seq得到24.42 Gb Clean Data。共鉴定出3321个 lncRNA,包括 2154 个 lincRNA、486 个 antisense lncRNA、534 个 intronic lncRNA、147 个sense lncRNA。这些lncRNA具有转录本长度短、ORF长度短、外显子数目少、结构简单、含isoform数量较少、表达水平低、分布广泛的特点。通过差异表达分析得到差异表达的lncRNA共1147个,527个上调表达、620个下调表达。差异表达lncRNA顺式和反式靶基因主要富集到细胞过程、单组织过程、生物调节、代谢过程等生物过程,主要参与细胞组成、细胞器组成和结合等分子功能,主要富集到WNT、HIPPO、MAPK、TGF-β等信号通路。差异表达lncRNA靶基因中有115个是BMD GWAS基因,通过STRING网站对这些GWAS基因进行互作分析,共鉴定出15个关键节点基因BMP4、LRP5、AXIN1、AXIN2、DKK1、SOX9、JAG1等,主要参与WNT、HIPPO等KEGG信号通路。通过与GWAS关联位点鉴定的lncRNA比较,两个数据集共有的lncRNA有6个,其中3个表达变化不显著,1个显著上调表达,2个显著下调表达。