基于组织特异性基因的药物新用途研究

被引量 : 1次 | 上传用户:aiming6946s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因组时代的到来,高通量生物技术的不断完善以及生物信息学的发展,传统的生物化学与分子生物学研究单个基因或蛋白的方法已经不再适用,取而代之的是将整个系统作为研究对象的系统生物学方法。随着基因组学、蛋白质组学、转录组学、相互作用组学、疾病组学研究以及药物组学的深入开展,产生了海量的生物学数据。丰富的数据信息为全面理解生物学本质提供了机遇与挑战。只有进行整合研究才能反映出生物系统的真实性。具有相同遗传信息的同一个体的体细胞其所利用的基因并不相同,有的基因是维持细胞基本代谢所必须的,而有的基因则在一些分化细胞中活动,这正是细胞分化、生物发育的基础。而组织特异性基因是在不同的细胞类型中进行特异性表达的基因,其产物赋予各种类型细胞特异的形态结构以及生理功能。这些基因的表达与否,决定了生命历程中细胞的发育、分化、细胞周期的调控、体内平衡、细胞衰老、甚至于程序化死亡。近期有研究报道,结合组织特异性、基因的关联性以及疾病的相关性的分析结果显示,疾病(非癌症)相关的基因通常在疾病发生的组织中表现出组织特异性。此外,已有许多研究将组织特异性作为诊断标记物以及药物靶点的一个基本特征。在组织工程、基因工程、再生医学等方面,组织特异性以及组织特异性基因的研究正深入开展。目前对人类正常组织的组织特异性基因筛选工作已有许多的报道,并构建了许多相关的数据库,例如BioGPS, TiGER, COXPRESdb以及TiSGeD等。这些人类组织特异性基因数据库收录了许多种组织中特异性表达的基因。但是这些研究大都只关注组织特异性基因的表达分布,而忽略了包括生物学通路在内的一系列生物学特性。如能将这些基因与其所属功能,表达产物的亚细胞定位,相关的疾病,以及其靶向药物信息结合起来,组合一个多因素网络模型并构建综合性的数据集,从系统生物学角度进行分析,必将能充分挖掘其中有用的生物学价值,产生有价值的生物学以及医学假说,为实验研究提供指导与帮助。本研究通过对近130种人类正常组织表达谱芯片的分析,筛选得到组织特异性基因,同时系统整合包括亚细胞定位,Gene Ontology的细胞组分、分子功能、生物学过程注释,生物学通路,哺乳动物(小鼠)表型,相关疾病以及靶向药物在内的生物学信息。这使得本研究构建的数据集既可以作为一个组织特异性基因的查询工具,又可以充当一个分析平台,对于一个未知的基因集进行分析,挖掘有价值的信息。组织特异性基因的筛选涉及到一个多重比较问题,即要判定一个基因是否具有组织特异性,要对这个基因在多种组织中的表达值进行比较。对于组织特异性基因进行筛选的表达谱芯片数据尽管已有不少,但是因为这些芯片数据的组织种类较少,同时样本量偏低,因此无法保证筛选得到的组织特异性基因的特异性。2004年Novartis研究中心的Andrew Su课题组对79种人类组织(其中正常组织73种)的mRNA表达的组织特异性进行了芯片分析。2006年Wyeth制药集团生物信息研究中心的Shuang Liang等人利用Affymetrix表达谱芯片对97种人类正常组织进行了组织特异性基因的筛选。本研究整合了这两组芯片数据,使得总样本量超过4000例,组织类型达130多种(去除冗余后),以期通过大样本量以及全面的组织类型保证筛选得到基因的组织特异性。使用自主开发的R语言脚本进行组织特异性基因的筛选分析。针对同一基因在不同组织中特异性的比较,以及不同基因在同一组织中特异性的比较这两个问题,计算特异性指数τ。Affymetrix芯片的探针通过在线工具转化为EntrezGene ID。组织名称根据标准的解剖学定义进行统一,对于两组芯片数据中冗余的记录,取其τ值的平均值。结果显示通过R语言程序筛选得到了3,960种组织特异性基因,共覆盖127种人类正常组织与细胞类型。平均每一个组织特异性基因在2种组织中特异性表达。对筛选得到的这3,960个组织特异性基因,通过可靠的数据源进行亚细胞定位、基因本体、生物学通路、哺乳动物表型、相关疾病以及靶向药物等六个方面的注释。基因-疾病关系通过整合以下三部分数据:通过自主开发的文献挖掘程序对NCIBI的Gene2MeSH数据库调取与整理的结果,Comparative Toxicogenomics Database中Gene-OMIM关联信息,以及瑞典Swiss-Prot数据库蛋白质-疾病关系数据集。组织特异性基因表达产物的亚细胞定位数据收集自LOCATE数据库。同时以Gene Ontology注释中的Cellular component为补充。另收集GO注解中的Molecular function与Biological process作为功能的注释。生物学通路数据包括了KEGG的通路信息和Reactome的相互作用数据。哺乳动物表型数据选自Mouse Genome Informatics数据库。靶向药物信息来自于Drugbank数据库的Drugcard数据集。对注释结果统计显示,一共收集到基因-疾病关系记录5,684条,基因-药物关系2,148条,另有Gene Ontology注释40,058条,亚细胞定位信息3,687条,生物学通路注释6,359条以及哺乳动物表型注释32,397条。结合其特异性表达组织信息,这3,960个组织特异性基因得到了全面详实的功能注释,亦为生物学关系的挖掘与假说的提出奠定了基础。本系统的基本查询功能基于MySQL的query语句,界面为MySQL的phpMy Admin,输出结果通过PHP以及javascript语言进行统计与整理。其中通过javascript来完成富集分析中Fisher Exact Test的p值计算以及多重比较中Benjamini-Hochberg correction的p值校正。可以通过简单的SQL语句分别查询组织特异性基因的各方面注释信息以及所收录的组织/细胞中的各组织特异性基因。而利用SQL批量查询功能,可以对一个基因集中组织特异性基因进行分选,并对其相关的组织特异性、亚细胞定位、生物学通路、哺乳动物表型、相关疾病、靶向药物等生物学特性进行富集分析。通过本数据库的MySQL Query批量分析基因集可揭示出其中的生物学联系并得出一些有意义的假说。同时,根据不同需要整合不同限制性条件的查询语句可以对同时满足多个特性的组织特异性基因进行筛选。类似“在血液中特异性表达的,与急性髓细胞性白血病相关的,同细胞凋亡相关的膜蛋白”的查询对于药物靶点以及诊断标记物的发现具有重要意义。本研究通过对牙周炎(Periodontitis)进行疾病组织特异性基因的检索,得到8个组织特异性基因。对这8个基因进行疾病类型富集分析,结果显示其中有IL1B, IL1RN, IL6, FCGR2A, FCGR3B 5个与类风湿性关节炎(Arthritis, Rheumatoid)亦有关联(p<0.050)。对5个共同的组织特异性基因进行组织富集分析,结果显示这5个基因主要富集在与免疫相关的组织中(p<0.050),如Blood、Bone marrow、PB-CD56-positive NK cells、Thyroid gland等。这与牙周炎与类风湿性关节炎都是与免疫相关疾病的事实相符。本研究对5个共同的组织特异性基因进行生物学通路富集分析,结果显示这5个组织特异性基因富集在17条通路中(p<0.050),其中包括Cytokine-cytokine receptor interaction、Toll-like receptor signaling pathway、Natural killer cell mediated cytotoxicity等通路,这与前人报道基本一致。另有研究显示,接受牙周炎非手术治疗患者的类风湿性关节炎症状有明显的减轻,而接受anti-TNF-a therapy的类风湿性关节炎患者其牙周炎的症状亦有明显的减轻。本研究对5个共同的组织特异性基因进行靶向药物富集分析,结果显示共有22种靶向药物,包括TNF-抑制剂,如靶向FCGR2A和FCGR3B基因的Adalimumab、Etanercept等(p<0.050)。综上,本研究通过以组织特异性基因为桥梁,联系疾病、药物关系的方法,证实了Adalimumab与Etanercept这两种药物对于牙周炎与类风湿性关节炎的症状都有缓解作用。子宫内膜异位症(Endometriosis)是临床常见妇科疾病,而免疫系统的异常可能是引起并促使子宫内膜异位症发生发展的重要因素之一。对辛伐他汀靶向组织特异性基因的特异性组织分析结果显示,这些基因主要富集在免疫相关的组织中。辛伐他汀靶向MMP9、IL6、CCL2这3个子宫内膜异位症相关组织特异性基因(p<0.00001),其的GO Biological Process注释富集分析显示,这3个基因同humoral immune response、inflammatory response、cytokine-mediated signaling pathway等免疫过程密切相关(p<0.050),与文献报道基本一致。这显示辛伐他汀通过对MMP9、IL6、CCL2的靶向作用可以干预到子宫内膜异位症相关免疫学过程。2009年Antoni J. Duleba等人的研究报道显示,在裸鼠模型上辛伐他汀表现出了防止子宫内膜异位症发生的保护作用。这与本研究所作的预测相吻合。因此可以合理推断,辛伐他汀可以作为防治子宫内膜异位症的候选药物进行进一步的临床试验。通过以上两个例子说明本研究构建的组织特异性基因数据库为探索药物新用途提供一定的指导,具有很强的应用价值。亦说明本数据库的构建对于充分利用组织特异性基因的重要生物学特性并得到新的生物医学发现具有重要意义。同时,本研究通过蛋白-蛋白相互作用以及GO富集分析方法,预测了辛伐他汀对于一型短QT综合症的疗效,初步推导出辛伐他汀可能通过间接影响离子转运平衡来实现对一型短QT综合症治疗的机制,为后续生物学实验验证提供了依据。综上,本研究通过整合多个可靠的数据集中关于组织特异性基因注释信息,构建了一个分析平台。通过自组SQL语句,可从复杂的关系模型中利用基因与组织、亚细胞定位、药物的关系筛选药物靶点以及诊断标记物,亦可以进行多个基因在某些生物学通路、疾病方面的富集分析。最重要的是,可以根据以组织特异性基因为媒介的生物学关系产生许多关于发病机理、诊断、预后以及治疗研究的假说。但是本系统仍需进一步完善。组织特异性基因的筛选算法将进行进一步优化,在降低假阳性率的同时,减少组织特异性基因的遗漏。由于数据来源的限制,目前未能收录疾病组织的信息。本研究下一步将会收录并分析疾病组织的表达谱芯片数据,以发现疾病组织特异性基因。今后也将重点关注组织特异性基因在发育、分化、应激反应与病理学中所起的作用以及组织特异性转录调控。同时,开发并优化更高效的SQL语句,使数据库中有价值的信息在药物副作用、诊断标记物筛选、治疗靶点选取等方面得到充分利用。
其他文献
<正>三星董事长李健熙宣布将1996年定为“设计革命年”,随后两年间,三星从一个以工程技术为核心的二流消费电子制造商逐步转型成一个以市场为主导、
伺服压机现在已经在中国的各个汽车主机厂得到了应用,本文首先介绍伺服压机的优势,然后分别从材料利用率、表面质量、回弹和模具冲击力等4个方面验证了伺服压机对冲压工艺性
为探讨GmKAB1在大豆处于低钾胁迫下的表达水平,以大豆钾高效品系油06-71和钾敏感型品系衡春04-11为试验材料,设置低钾胁迫试验,分别在处理后0.5h、2h、6h、12h、3d、6d、9d和
清代以优厚的垦殖条件吸引了大量的外省人口进入广西谋生,除务农之外,务商者、开矿者等各式流民纷纷进入,导致清代广西人口剧增,同时也为广西带来了先进的物质与精神文化。为
本文介绍了新生产线7020合金熔炼工艺与铸造工艺参数,并对铸造裂纹缺陷进行了分析,提出了相应的预防措施。
<正> 产业结构升级与城市化进程相辅相成,目前我国的城市化滞后,对产业结构升级形成制约,因此,应加速城市化,促进产业结构升级。从产业结构升级的角度来看,我国现阶段城市化
通过对部分国内外通信运营和互联网领域标杆企业近年来新公开专利进行检索和统计,对相关专利涉及的数量、技术方案和业务应用进行研究,初步分析这些标杆企业的技术发展动向、
孟郊、梅尧臣诗中的穷苦之吟主要包括仕途的失意和政治理想未能实现的苦恼以及生活的饥寒贫苦等方面的内容。其相同之处在于二者都坚守儒家的道德人格,不同之处则表现在艺术
随着工业技术的发展,对发动机的技术要求越来越高,而气缸盖作为发动机最关键的零部件之一,承受着强烈的热负荷、机械负荷,其性能的重要性日益凸显。对气缸盖的设计要求,不仅
采用酸分解试样,在酸性介质中,以二氯化锡还原大部分三价铁,三氯化钛还原剩余三价铁,用重铬酸钾滴定测全铁量。本法加入浓硝酸溶解样品,使溶解更完全,提高了溶解温度,加快了