基于R语言的DNA微阵列数据分析与挖掘平台的构建

来源 :重庆大学 | 被引量 : 0次 | 上传用户:luwei0415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA微阵列(即基因芯片)是诞生于上世纪末的一项伟大技术,它是迄今为止最重要的基因表达调控研究技术之一。面对公共数据库中与日俱增的基因芯片表达谱数据,如何高效地从海量的数据中提取和发掘有用的生物学知识便成为当前生物学家遇到的最大挑战。虽然已有多种用于基因芯片数据分析的软件,但大多数软件的分析模块化,定制性较差,不适合二次开发,对新算法的兼容和容纳能力也很有限,不能满足深层数据挖掘的需要。为了深入分析和挖掘蕴藏在基因芯片数据中的重要信息,本研究基于开源的R语言编程平台,以Bioconductor为生物计算环境,利用多种软件包在本地服务器上构建了一个用于的基因芯片数据分析和挖掘系统。并采集公共数据库中已发表的Affymetrix寡核苷酸微阵列原始数据GSE470,对构建的芯片数据分析系统进行了包括基因芯片数据的获取、预处理、质量检测、差异表达基因的筛选、GO注释、聚类分析、pathway分析、基因表达调控网络和分子互作网络的分析与可视化等多项实际测试。GSE470芯片数据组的测试结果发现,哮喘患者与正常人体存在PIP、MMP1、PDPN等33个差异表达的基因,两者间最大的信号通路差异在于氧化磷酸化途径发生了变化;同时预测出了以该组差异表达基因为关键节点的哮喘相关基因表达调控与互作网络,发现MMP1、S100a7、DBC1与RPA2等多个关键性的调节点。以上通过该平台取得的预测结果与哮喘研究领域已经公开发表的结论一致,并不断被新的文献所证实。此外,应用构建好的数据分析平台对GSE470、GSE13396和GSE41649三组数据进行通路综合分析,显示有多条通路在哮喘病人体内发生了显著改变,提示这些信号通路的研究可能为哮喘的分子机理研究提供佐证。上述的结果表明,构建于本地windows平台下的芯片数据分析系统可快速、高效、精准地处理和分析以Affymetrix寡核苷酸微阵列为代表的基因芯片数据,最大限度地挖掘大量基因芯片数据背后所隐藏的丰富的生物学知识,加深科研人员对疾病的分子机理等生物学问题的理解。
其他文献
目的:观察健脾益气方含药血清对人肝癌细胞SMMC-7721增殖与侵袭能力的影响。方法:以TGF-β1诱导人肝癌细胞SMMC-7721上皮-间质转化(EMT)模型,制备健脾益气方大鼠含药血清,分别以0
期刊
清乾隆时期西迁至新疆的达斡尔人在其族群发展过程中经历过多次变迁,这一变迁过程基本以索伦部之下的达斡尔——索伦营之下的达斡尔——索伦族——达斡尔族为脉络而呈现。新
目的:探讨环氧合酶-2(COX-2)和膜结合型前列腺素E2合成酶1(mPGES-1)在肾透明细胞癌组织中的表达及临床意义。方法:采用免疫组化SP法分别检测49例肾透明细胞癌组织标本和21例正
如何在"微时代"背景下,将思政教育工作做好,作为当前高职院校辅导员工作的一个重要工作。本文主要介绍了高职院校辅导员的思想政治工作,结合当前微时代的背景下,提出了高职院
贺拉斯的古典主义创作三原则:借鉴原则;合式原则;合理原则,开启了长久统治西方的古典主义文艺思潮,特别是对15和16世纪的文艺复兴运动,对17和18世纪的新古典主义运动影响尤为
股利政策失当是中国上市公司长期以来存在的顽疾之一。制定科学合理的股利政策是上市公司应尽的责任与义务。本文基于股权资本成本视角,站在股东利益保护的立场,从企业内部财
全球经济一体化背景下,公司治理结构问题成为各国普遍关注的重大课题.在经济转轨时期,我国上市公司治理问题有其特殊性,基本的公司治理缺陷表现为控股股东的"一股独大"问题,