大脑中动脉闭塞的芯片数据挖掘及生物信息学分析

来源 :山东大学 | 被引量 : 0次 | 上传用户:killer258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
第一部分:研究背景脑血管病是威胁全世界人类生命健康的一类疾病,它是继肿瘤之后,在世界上引起人类死亡疾病病因中位居第二位。目前我国每年新发病例约150-180万,死亡将近100万,是我国城市死因的主要原因。据全国第三次死因回顾抽样调查报告显示,脑血管病已上升为我国人口死亡原因之首。在脑血管病中,缺血性脑血管病最为常见,其发生率约占全部脑卒中的70%-80%。颅内血管狭窄是造成缺血性脑血管病的一个重要原因,其中又以大脑中动脉狭窄或闭塞发生率最高,占颅内动脉病变的66%-73.3%。研究发现患有大脑中动脉闭塞性疾病(middle cerebral artery occlusive diseases, MCAOD)每年同侧脑缺血事件再发的几率约为9.1%,而中国人有着更高的脑血管事件再发几率。从分子水平研究大脑中动脉闭塞的发生发展,对于该疾病的预防、控制和治疗具有重要意义。基因芯片技术是21世纪生命科学领域的一项重要的技术平台,能够有效地筛选差异表达相关基因,具有快速测量和高通量等优点。鉴于表达谱芯片技术在研究细胞基因表达模式上的优势,基因表达谱芯片技术目前已广泛应用于疾病的发生机制、早期诊断、指导治疗以及评估预后等相关的研究领域。随着表达谱芯片技术的不断发展,产生了海量的复杂的生物信息学数据。然而如何解读芯片上成千上万的基因点的杂交信息,揭示其中蕴含的生命特征和规律,己成为制约基因芯片技术应用和发展的主要问题。生物信息学是一门交叉学科。它整合了包括信息学、计算机科学和统计学等多种技术手段来分析海量的生物数据所包含的信息从而揭示这些生物数据所赋有的生物学奥秘。它以生物芯片研究为基础,先对生物芯片的海量数据进行初步筛选,再运用序列比对、统计分析、生物聚类、通路分析、可视化作图、以及启动子预测等方式,进行数据挖掘,从而对疾病从分子水平进行分析,阐述对疾病进展的认识。随着生物信息学的发展,已经形成了新的生物学研究模式,即利用现有的数据信息,先进行理论推测,再进行实验验证。本研究以GEO数据库为研究基础,以两组小鼠大脑中动脉闭塞相关的基因表达谱数据为分析材料,旨在通过筛选大脑中动脉闭塞的差异表达的基因,联合生物信息软件和方法对这些差异表达基因之间相互作用关系及富集功能进行分析,从而探索与大脑中动脉闭塞相关的基因、通路、转录因子、miRNA等,为更好地理解大脑中动脉闭塞的发生、发展的分子机制提供重要的信息,也为大脑中动脉闭塞的分子诊断和个体化治疗奠定基础。第二部分:大脑中动脉闭塞差异表达基因的筛选与生物信息学分析目的:大脑中动脉闭塞发生的生物学过程十分复杂性,因此从基因组水平筛选与大脑中动脉闭塞发生相关的功能基因成为该疾病研究的重要途径。本章中利用基因芯片GSE35338对大脑中动脉闭塞引起的缺血性中风的差异表达基因进行筛选,并对这些差异基因进行功能注释、通路分析及蛋白质互作网络分析,为探索大脑中动脉闭塞发生、发展的分子机制提供理论基础。方法:从GEO公共数据库下载编号为GSE35338基因芯片数据(物种:小鼠)。该数据集包含21个样本,分为实验组和对照组,实验组为大脑中动脉闭塞引起的缺血性中风处理组,芯片检测时间分别为处理后1天、3天和7天,除了第一天重复样本为5个,其他时间点都有3个重复样本,对照组为假实验组,对照组第一天重复样本数目为4,其他均为3个重复。对下载的芯片原始数据进行预处理后,筛选差异表达基因,筛选差异基因的标准为|logFC|>1.5和p-value<0.05。应用DAVID在线工具分析不同时间节点的差异基因的GO功能和KEGG通路富集分析,并筛选富集显著的GO条目和KEGG通路。之后分析3个不同观察时间的差异表达的基因的重叠情况并绘制相应的韦恩图。在韦恩图上挖掘在3个时间节点上都差异表达的基因,并做基因的功能富集分析。随后,利用STRING在线工具据筛选差异表达基因对应的蛋白质互作关系对,并利用Cytoscape构建蛋白质互作网络。最后利用MCODE插件构建子网络模块并对子网络模块的功能进行分析。结果:研究发现在处理后1天,3天和7天组分别筛选到294,87和57个差异表达基因。下调基因没有明显富集的GO条目及代谢通路。第1天筛选到的上调的基因主要功能体现对伤口的处理、免疫的反应、以及细胞的凋亡等过程;第3天的上调基因主要功能体现在细胞外区域等功能;第7天筛选到的上调基因主要富集的功能为免疫反应,炎症反应等。从韦恩图中发现32个差异表达基因在3个观察点出现差异表达的重叠情况,合并去重复差异表达基因后,共筛选出337个差异表达基因。在构建的PPI网络中,共筛选到22个联通度大于10的节点,其中Cxcl10和116连通度大于20。MCODE插件共挖聚到5个显著性子网络,主要参与了细胞周期,免疫应答,损伤应答以及细胞增殖等功能。结论:(1)对筛选出的差异表达基因进行功能注释与通路分析,为该疾病的实验室研究提供了理论基础。(2)成功构建了差异表达基因的蛋白质相互作用网络,其中Cxcl10和Il6可能参与大脑中动脉闭塞的发展过程,并为该疾病的诊断和治疗提供了新的研究方向。第三部分:PACAP38对大脑中动脉闭塞影响的分子机制研究目的:缺血后的3小时为再灌注的“最佳时间”,能够在6小时或稍长的时间内给予脑缺血病人有效及时的治疗,对于疾病的预后至关重要。本章中利用基因芯片GSE62884分析了药物垂体腺苷酸环化酶激活多肽38(PACAP38)处理大脑中动脉闭塞样本引发的基因表达水平变化,并对这些差异基因进行功能注释、通路分析及蛋白质互作网络分析,为我们系统理解PACAP38对大脑动脉闭塞影响的可能分子机制提供了理论基础。方法:从GEO公共数据库下载编号为GSE62884基因芯片数据(物种:小鼠)。GSE62884为双通道芯片,包含8个样本。实验组为PACAP38处理缺血核心区6小时和24小时,对照组为盐水处理缺血核心区6小时和24小时;另一组实验组为PACAP38处理半影区6小时和24小时,对照组为盐水处理半影区6小时和24小时。对下载的芯片原始数据进行预处理后,筛选差异表达基因,筛选差异基因的标准为|logFC|>0.58和p-value<0.05。应用DAVID在线工具对各组的差异基因进行GO功能和KEGG通路富集分析。随后,利用STRING在线工具据筛选差异表达基因对应的蛋白质互作关系对,并利用Cytoscape构建蛋白质互作网络。然后利用ClusterONE构建子网络模块并对子网络模块的功能进行分析。对各组差异表达基因进行文氏图分析,并对交集基因构建蛋白质互作网络并挖掘网络的子模块。随后,使用Cytoscape的iRegulon插件预测分析调控这些靶基因的转录因子。结果:缺血核心区6小时组筛选出123个差异表达基因,缺血核心区24小时组筛选出2009个差异表达基因,半影区6小时组筛选出126个差异表达基因,半影区24小时组筛选出1484个差异表达基因。缺血核心区处理组的差异表达基因主要富集到了趋化因子活性,免疫应答等相关的功能,半影区处理组的差异表达基因主要富集到了细胞增殖,免疫应答和细胞外区域等功能条目。缺血核心区处理6小时的差异表达基因的蛋白质互作网络包括16个节点和14个互作关系对。核心区处理24小时的差异表达基因的蛋白质互作网络包括961个节点和4633个互作关系对,并得到了4个显著的子网络模块。半影区处理6小时的蛋白质互作网络有33个节点和30个互作关系。24小时的蛋白质互作有681个节点,2873个互作关系对,并得到3个显著的子网络模块。文氏图分析发现有1039个交集基因,构建蛋白质网络发现Cxcl10和Il1b在2个组织2个时间点均上调表达。预测到的转录因子中Irfl、Bcl3、Nfkb1、Relb、Hic1、Ets1、编码基因存在于1039个交集差异表达基因中。结论:(1)对在PACAP38处理缺血核心区和半影区中均差异表达的交集基因进行功能注释与通路分析,为该疾病的实验室研究提供了理论基础。(2)构建的交集基因的蛋白质相互作用网络中,Cxcl10和Il1b在2个组织2个时间点均上调表达,可能在PACAP38治疗该疾病中发挥重要作用。第四部分基因芯片GSE35338和GSE62884整合分析目的:我们对两个基因芯片分析获得的基因取交集,并对交集基因进行功能富集分析,蛋白质互作网络分析,以及转录因子预测分析,从而进一步找出可能对大脑中动脉闭塞的发生和发展起关键作用的基因或通路。方法:基因芯片GSE35338共得到337个基因,基因芯片GSE62884得到1039个基因。我们对这两个基因芯片分析得到的337个基因和1039个基因取交集。应用DAVID在线工具对交集基因进行GO功能和KEGG通路富集分析,并使用Cytoscape的插件Enrichmentmap建立关联网络。随后利用GeneMANIA分析了交集基因之间的功能作用关系并建立功能作用网络。并对交集基因进行转录因子预测以及miRNA预测。结果:基因芯片GSE35338的337个基因,与芯片GSE62884的1039个基因取交集,共得到103个交集基因。这些基因显著富集到了损伤应答,炎症反应,免疫应答,以及细胞增殖等功能和通路。富集条目经过Enrichmentmap分析后发现GO:0009611-RESPONSE TO WOUNDING, GO:0006954-INFLAMMATORY RESPONSE, MMU04620:TOLL-LIKE RECEPTOR SIGNALING PATHWAY, GO:0005576-EXTRACELLULAR REGION等与其它条目关联数目最高。结合GeneMANIA分析得到的基因功能作用网络包括97个节点和1996个功能作用关系。预测得到的转录调控网络中包括有75个转录因子,其中,Bc13、Irf1、Maff、 Fosll、Stat6和Stat3有着很高的连接度。miRNA-靶基因关系对分析共获得2635个miRNA-靶基因关系对,包含668个miRNA,例如miR-124,miR-29c等。结论:(1)交集基因功能注释与通路分析发现,这些基因显著富集到了损伤应答,炎症反应,免疫应答等功能条目。(2)成功构建了功能条目关联网络,基因功能作用网络,转录调控网络,并成功预测了miRNA-靶基因关系对,这些转录因子和miRNA可能在大脑中动脉闭塞的发生发展过程中发挥重要作用,可能为该相关疾病治疗的重要分子靶标。
其他文献
116例育龄妇女自杀死亡因素分析郑全庆近年来,许多国家的成人死亡率和儿童死亡率均呈下降趋势,但自杀死亡率则呈上升趋势[1]。自杀后果会比疾病死亡带来更多的社会问题。据我国刘华清
本文用沪深两市2007至2013年的A股上市公司7年共计13669个样本,建立Logistic模型进行实证研究。研究得到如下结论:(1)过度自信的高管倾向于选择进攻型战略。(2)进攻型战略企
以二(3-氨基丙基)乙二胺为起始原料,经对甲苯磺酰化、与1,2-二(对甲苯磺酰氧基)乙烷闭环、硫酸脱保护、氢氧化钠碱化制得1,4,8,11-四氮杂环十四烷(5);5经N1,N4,N8-三保护、与
目前,我国老龄化程度不断加深,社会文明水平不断提高,老年人对老年教育的需求变得越来越强烈。而社区作为老年人常年居住和生活的地方,是进行老年教育的最佳场所之一。因此面
文章在我国地方政府融资主体、债务规模和方式进行现实分析的基础上,重点分析了创新地方政府融资模式和改进债务规模管理方式选择,并立足国情提出了针对性的政策建议。
随着测绘信息技术的不断发展,测绘科技档案管理中信息技术的应用也越来越广泛,信息管理促进测绘资料档案管理工作向着现代化、数字化、自动化的方向发展,是提高整个档案系统
采用差示扫描量热(DSC)、傅里叶变换红外光谱(FTIR)和原位傅里叶变换红外光谱(in-situ FTIR)研究了4-二甲氨基吡啶(DMAP)、乙醇胺对苯酚-苯胺型苯并噁嗪(pa)开环聚合过程的影
在对鄂东南大型矿业基地的矿产资源开发现状、社会经济效益、矿业经济活动对生态环境影响及其存在的主要环境地质问题进行初步调查分析的基础上,确定了鄂东南矿山地质环境评
为了有效地管理房产测绘数据,研究了GIS相关技术及其与房产应用的集成策略。从系统架构、数据库设计和系统功能设计三个方面对房产测绘信息管理系统进行了详细分析和设计。该
随着城市测绘技术的不断发展,城市测绘信息系统的建设为城市的发展规划提供了重要的地理信息服务,它是我国城市测绘技术发展到新阶段的表现。文章论述了我国城市测绘信息系统