芯片分析中的三重聚类方法及基因生物信息平台的构建

来源 :南京大学 | 被引量 : 0次 | 上传用户:daolong163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物芯片是近10年以来生命科学领域中迅速发展起来的一项高新技术,其主要特点是高通量、微型化和自动化。基因表达谱芯片可以同时检测成千上万个基因的表达,现已被广泛应用于基因组水平上的基因表达分析。由于基因芯片数据的海量性和复杂性,传统的数据分析方法已经不能很好的满足其需要。伴随着基因芯片技术的发展和成熟,各种改进的数学模型和分析方法也在不断涌现。其中,无监督学习(聚类分析)如系统聚类、k-means聚类、自组织聚类等,在基因表达谱芯片分析中的应用也越来越广泛。 现有的基于定量表达数据的聚类方法虽然能在一定程度上揭示基因表达谱芯片的表达模式,但它们也存在各自的和共同的缺陷。为弥补现有聚类方法的不足,本文提出了一种基于定性编码的三重聚类算法,在基因变化表达型定性编码的基础上,先对芯片数据进行基于定性编码的核聚类,然后再对第一次聚类的结果分别进行类间的系统聚类和类内部基因的系统聚类。我们用酵母基因组的基因表达芯片数据进行了测试,对聚类的结果我们还设计了基于信息熵理论的logus图和HHF图来展示。结果表明,我们聚类的结果有显著的生物学相关性,能够很好的阐述类之间的关系,能通过自适应的方式有效地排除无关条件的噪音,而且能够在某些情况下对基因表达的时序性进行处理,这些改进能够对现有应用于基因表达芯片分析的聚类算法做出有益的补充。 同时,为了便于实验工作者更有效和方便地利用现有生物信息资源来指导实验和分析数据,特别是高通量的基因芯片数据,我们开发了一个基于WEB和数据库技术的基因生物信息查询与分析平台。通过这个平台我们可以查询以基因为中心的基因注释信息,基因功能信息,基因代谢和表达调控通路(pathway)信息以及基因的组织特异性表达信息。此外,我们提出了基于二项分布的基因集富集分析方法,该方法可以对任意有意义的基因集进行分析,并能够揭示基因之间及基因与各种生物信息之间(功能,pathway和组织)的联系。 我们将该平台用于PGC-1相关的基因表达芯片数据,一方面,我们的分析结果与现有知识有高度的一致性,这证明了我们的平台在生物信息挖掘上的有效性,另一方面,我们的分析结果中还存在迄今为止尚未有报道的基因之间及基因与生物信息之间的联系,这表明我们的信息平台可以用于揭示新的生物信息相关性,并为实验设计提供有益的指导。
其他文献
随着人口的快速增长和城市的加速发展,城市化地区土地利用方式发生了巨大的改变。本文根据1988,1998和2003年南京地区TM影像资料,提取出农田、林地、水体、城镇、裸地5种土地利
油松毛虫(Dentrolimus tabulaeformis Tsai et Liu)属鳞翅目(Lepidoptera)枯叶蛾科(Lasiocampidae)松毛虫属(Dendrolimus),是我国北方森林危害最大的食叶害虫。以往对油松毛虫的
人重组粒细胞集落刺激因子(rhG—CSF)能够促进造血干细胞向中性粒细胞增殖、分化。还可动员成熟中性粒细胞从骨髓进入外周。rhG—CSF已经成为现今抗肿瘤化疗,放疗以及骨髓移植
随着人类社会的快速发展,带来了严重的能源危机和环境污染的问题,威胁着人类的生存。为了建设可持续发展型社会,以太阳能、风能、水能为代表的可再生清洁能源的发展最为迅速。我国太阳能资源丰富,光伏发电具有很大的发展前景,目前我国是世界上光伏发电装机容量最大的国家,但是光伏出力具有随机性、间歇性和波动性的特点,这给电力系统的调峰造成了很大的影响,严重限制了光伏发电在电力系统中的渗透率。为了更好地消纳光伏发电
真核基因的转录调控是基因表达调控最为关键的步骤,转录调控信息的提取和分析预测对理解复杂基因调控网络具有重要指导意义。基因转录调控主要是由转录因子承担的,它们通过结合
古树是重要的遗传资源,也具有重要的科学价值、人文价值和景观价值。近年来,古树常用于研究全球气候变化。因此,研究我国的古树资源,包括研究其地理分布规律及其健康状况,对于了解
针对各种情形下的车牌定位研究具有非常重要的意义。车牌识别系统(LicensePlateRecognition,LPR)是智能交通系统重要的组成部分和支撑技术,广泛应用于高速公路电子收费站、停车
论文讨论了等节跳科(family Isotomidae)七个属的系统分类,其中两个为中国新纪录属。 文中从命名,形态学和生态学方面对弹尾纲进行了介绍。对等跳科的历史和主要分类特点进
学位
本论文以我们自主培育的3个水稻核不育系HE31S、西胜217S和DIS为材料,以培矮64S为对照,对其农艺性状,育性转换特性、败育的细胞学基础和配合力等进行了研究,旨在为这些不育系的应