基于混合线性模型和条件变量分析的DNA微阵列数据分析方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:jiaomoji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来DNA芯片技术日益成为研究大量基因表达连续变化的实验室工具。芯片技术的发展使得同时获得成千上万个基因的表达谱成为可能。DNA芯片在产生的短短几年时间已经显现出在基因序列分析、基因诊断、基因表达研究、基因组研究、发现新基因及各种病原体的诊断等生物医学领域中的应用价值。利用芯片数据,“癌变基因”的发现以及对飞速增长的基因组数据库增加功能注释等难题将迎刃而解。DNA芯片数据具有高维(成千上万个基因)和样本小(通常小于30)的特点,为了避免对伪结果进行分析,准确估计抽样方差很重要。在微阵列试验中既要包括真实的变化,又需要随机的变异。大量研究表明,聚类分析及其相关技术对于挖掘基因表达的相关模式非常有用。但是仅用这些方法不能对分析结果进行统计推断,难以得到具有生物学意义的结论,尤其是不适合分析前后时间点数据高度相关的动态基因表达数据。 本文描述的统计框架包含了基因表达分析的众多目标,与现有的分析方法完全一致,同时提高了这些方法的效用。本文着重研究差别表达基因的鉴定。本研究提出了基于混合线性模型的分析微阵列数据的方法,并将其应用于差别表达基因的鉴定、在动态或静态过程中估算基因主效应以及预测基因与环境的互作效应。用蒙特卡罗模拟对该方法的有效性和可靠性进行了比较系统的研究。这种方法可以有效地将基因表达水平根据变异来源的不同剖分为几个组成部分。主要研究内容和结论概述如下: 1.提出了分析芯片数据的一般模型,其中包括了基因、阵列效应、染料、处理效应以及基因×阵列、基因×染料、基因×处理互作效应。根据不同的试验设计,该模型可以做适当的调整。本文提出的方法主要分为两步来进行:首先,将芯片数据通过噪音过滤消除大的试验系统误差,然后在一个比较宽松的标准下通过单基因模型初步判断差异表达基因;其次,用多基因模型分析这些初定的差异表达基因以便在较严的标准下控制假阳性。用MINQUE法估计各项效应的方差和协方差分量,用AUP法预测随机效应。基因和处理的互作效应作为鉴定差异表达基因的具体指标。 2.对新提出的基于混合线性模型分析DNA芯片数据的方法用蒙特卡罗模拟进行了验证。模拟结果表明该方法在绝人多数情况下忧于传统的t检验和 WOlfinger提出的混合模型方法。验证了基因和处理的互作效应可以作为鉴定差异表达基因的更为恰当的指标。 3.研究表明我们提出的基于混合线性模型的方法可以无偏或近无偏地估算固定效应和预测随机效应。对基因主效应的无偏估计值和基因与处理互作效应的无偏预测值进行聚类可以获得具有统计学和生物学意义的结果。 4.将我们提出的混合线性模型进行拓展,可以用来分析动态的基因表达数据。我们定义了一个新变量度量给定卜1时刻的基因表达量来确定1时刻的基因表达情况,用条件变量的方法来估计条件方差、预测条件遗传效应,可以揭示在特定时间段基因表达的变异情况。 5.对新提出的基于条件变量的分析芯片数据的方法进行了蒙特卡罗模拟研究。结果表明基于条件变量的分析方法在大多数情况下表现得比差值法更有效。同时结果还进一步显示了将基囚和环境的互作效应作为鉴定差异表达基因的指标是非常有效的。 6.为了适应实际分析的需要,用C/C++语言编写了软件,可以用于分析基因芯片的表达数据,估算基因表达变异来源的方差组成和预测遗传效应,同时寻找差异表达基因。 7.以几种药物处理特异癌症细胞系的实际芯片实验数据的分析为例,说明了本研究所提方法的分析过程及分析所得结果的生物学意义。
其他文献
本文主要讨论三个方面的内容:建立粒子运动模拟方法(SPMVIF)的几何分析框架、应用水平集方法(Level Set)对参数Snakes模型做基于拉普拉斯算子的分析以及EDEK图像分割算法的讨论和分割效果的评价。我们运用一些数学技巧和工程思想对SPMVIF、Snakes等模型展开了理论分析,获得了一些重要的结果。最后讨论图像建模的要素以及EDEK分割算法的实现和评价。 梯度方向二阶导数过零原理
交通路口异常事件是影响交通正常运行的重要因素,且交通路口作为公共出行集中度较高位段,公共安全事件的发生影响范围广。随着城市发展和生活水平的逐步提高,快速的城市化过程,使得北京迅速成为排名世界前20位的超大型城市。但是,同样随着城市的发展和机动车量的迅速增加,城市交通环境急剧恶化,交通拥堵成为城市的常态,据统计60%-70%交通拥堵受到交通事故的影响。本课题研究为交通路口异常事件检测和识别提供了研究
细胞的膜结构分隔了细胞内外以及胞内各亚结构之间的不同组分与空间,同时也参与了细胞与外界的连接以及物质在这些亚结构之间的有序运输及浓度梯度。细胞膜的动态性常常与细胞骨架动态性和脂膜成分的代谢密切相关。这些过程是在蛋白质的严格调控下进行的。细胞迁移是细胞膜动态性非常活跃的过程,在生物体的发育和愈伤过程乃至癌症的发展中都具有重要意义。在细胞迁移活动中,囊泡运输、微丝骨架的重排和连接复合物结构的组装等多种
颗石藻是分布最广、数量最丰富的钙质海洋浮游植物,在全球海洋生物泵和碳酸盐反向泵中起着关键性作用。通过颗石粒钙化,及其对有机碳的压载作用,颗石藻对全球海洋碳循环有着重要影响。颗石藻生产力贡献了全球海洋初级生产力的5-40%,而对于碳酸盐泵的贡献则可超过50%,在旺发时期甚至能超过了 80%。颗石藻群落组成及生产力对海洋环境变化有着强烈的响应,加之能够较好的保存于沉积物中,因此沉积物颗石粒常作为海洋微
通过基因组规模的遗传学筛选,我们鉴定出了120个对钙离子敏感的酿酒酵母基因缺失株。这些基因的功能与细胞代谢、蛋白质分选、离子稳态、转录、细胞内运输、细胞周期和高渗胁迫应答等方面相关。其中7个基因编码ESCRT-I,-II,和-III蛋白复合物的成分,这些复合物的功能是形成能够分选蛋白质到液泡或溶酶体的多泡复合体(MVB)。在胞外钙离子胁迫条件下,这些ESCRT缺失株的细胞质内钙离子浓度升高,并激活
本文通过实验和理论相结合的方式,研究了 Au55Cu25Si20金属玻璃的结构特征以及它在高温和高压下的行为,同时也探究了Ca,Al金属液体以及Ca72.7Al27.3金属合金在高温高压下的结构演变。Au55Cu25Si20金属玻璃的结构特征表现为局域原子的堆积以9,10,11配位的多面体为主,而不是以类二十面体团簇为主,同时这些9,10,11配位的多面体中小尺寸的团簇互相排斥,而大尺寸的团簇互相
学位
本文以拟南芥矮化突变体abs1-1D(abnormal shoot1-1dominant)为研究对象,针对abs1-1D与植物激素油菜素内酯(Brassinosteroid, BR)关系,对ABS1的功能、表达特异性进行了研究。同时也对ABS1的同源基因At5g47980进行了研究。主要结论如下:(1)从拟南芥激活标签突变体库中获得了一个与野生型生长发育存在显著差异的矮化突变体abs1-1D。与野
随着计算机技术和快速数值算法的发展,大尺度散射问题受到广泛地关注和研究。一维结构的山地和都市环境中的波传输都是无线通信研究中的重要课题,其传输特性需要对大尺度轮廓剖面的数值模拟来反映。二维随机粗糙面的散射问题是主、被动遥感中的重要研究课题,用蒙特卡洛数值模拟时,是以有限大的二维粗糙面反映无限大的实际粗糙面的电磁特性,需要足够大的模拟尺寸才能得到收敛于无限大粗糙面的散射特性。这些大尺度问题的矩阵方程
莲是我国的重要的水生蔬菜,具有很大的经济和观赏价值,我国很早就开始利用莲的食用价值和药用价值。目前人们已经从莲的分类学、形态学、生理学、药物学等方面进行了深入的研究。作为一种重要的经济作物,关于莲分子克隆和转基因等方面的研究却比较匮乏,抗氧化酶(MnSOD、CuZnSOD、APX和CAT等)可以清除体内的活性氧离子(ROS),以延缓机体的衰老和增强植物的抗逆性。本文克隆得到了几个重要的莲抗氧化基因
在哺乳动物卵巢中,原始卵泡的激活、生长和发育决定了卵子发生,而原始卵泡的耗尽决定了更年期或者雌性生殖期的结束。然而,调节这些过程的分子机制尚未阐明。本研究利用蛋白质组学方法鉴定家猪和野猪卵巢内的差异表达蛋白,从而在蛋白质组水平上寻找人工选择的印记。长期人工选择改变了卵巢基因的表达,并且主要是通过转录水平进行调控。总共鉴定了38种差异表达蛋白。功能分析显示它们参与了许多重要的生物学过程,包括细胞骨架