基因芯片数据的三维数据分析模型探讨

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:sqqmyquanqs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片是近年发展起来的自动化的、高通量的研究生物学问题的一门新技术。它综合了多学科的成就,在大规模研究基因功能的领域中已经有了卓有成效的应用。随着越来越多的针对不同生物学问题的基因芯片实验的完成,基因芯片数据呈爆炸性增长,各种各样的分析方法也随之出现。对大量产生的数据如何有效地分析,成为生物信息学研究中的一个热点。 针对基因芯片数据高噪声、高维数、小样品的特点,本文先对拟南芥幼苗基因芯片数据(22746个基因,58个样品)进行3种相关预处理,减弱了数据噪声;对预处理后的数据进行主成分分析,消除了共表达基因的重叠信息,再对58个样品进行系统聚类;聚类结果显示58个样品不能完全按照4种不同外界处理(正常条件(CK)、紫外线照射(UVB)、盐处理(SL)和干旱(DR))分成4类。因此,在原来二维(样品维和基因维)的基础上增加一时间维,建立基因芯片数据的三维数据分析模型。数据模型显示,基因表达的变化受到时序和外界处理的交叉影响。这就造成了不同外界处理的样品在相同时间点聚在一起。使用基因维载荷大的基因对样品进行聚类,聚类结果有明显改进。 本文还研究了约束条件下选取主成分的偏最小二乘方法和选取基因的MAXR方法。
其他文献
期刊
曾任国务院副总理兼国家计委主任的姚依林,晚年老练沉稳,寡言慎行。据国务院发展研究中心主任王梦奎同志回忆,姚在出席国务院会议和其他高层会议时,很少讲话,但所讲必深思熟
导入感知概念是展开数学概念课教学的首要环节,而优化的导入方式能使学生正确地认知理解数学概念,明晰其内涵和外延,并解决相关问题。本文拟从导入法的探究性、主动性、创造
张爱玲是我国文学史上举足轻重的作家,把她的写作风格拿出来分析很有助于后世的文学创作。在其笔下,有痴男怨女,有已经腐化的社会,有想突破但被困住的青年灵魂。文笔细腻如张爱玲
本文从路灯照明工程的实际出发,分别从路灯设计、降压、绿色照明等节能途径和方式,就如何以科学的实现道路照明的节能,阐述几点体会。
期刊
Pascal线是代数曲线中的重要概念,同时也具有重要几何性质。而代数曲线又是非常重要的研究对象和工具。尤其是经过近年来的研究,人们发现多元样条空间的奇异性问题与代数曲线的
在当今市场经济条件下,财务报表舞弊行为泛滥,而且通过一系列审计程序却未能发现企业报表中所存在的问题,审计失败案屡屡上演。文章结合财务报表舞弊的具体原因,从财务报表审计中
期刊
日前,一批从美国进口的42标箱、447吨废纸到达江阴港,成为近年来首批到港的大批量进口废纸。江阴有长江纸业、永丰余纸业等数 Recently, a batch of 42 TEUs imported from
本文主要讲城乡一体化规划的内涵与外延,总结了过去处理城乡结合部问题的途径与弊端,并提出城乡一体化规划的内容与方法及城乡一体化规划在规划序列中地位的认识,城乡一体化
期刊
由于人工神经网络(ANN)在最优化、信号处理、图像处理、模式识别和联想记忆等方面的广泛应用,人工神经网络得到了蓬勃发展.人工神经网络的信息处理能力取决于其动力特征.因此