【摘 要】
:
随着DNA芯片技术的广泛应用,基因表达数据分析已成为生命科学的研究热点。DNA微阵列技术是一种研究细胞中基因表达模式的非常有效的技术。这种技术而临的主要挑战是如何分析由
论文部分内容阅读
随着DNA芯片技术的广泛应用,基因表达数据分析已成为生命科学的研究热点。DNA微阵列技术是一种研究细胞中基因表达模式的非常有效的技术。这种技术而临的主要挑战是如何分析由此产生的大量基因表达数据。最近,一种新的基因表达数据--时序基因表达数据受到了越来越多的重视。时序基因表达数据根据细胞循环过程,在不同时间点对各基因采集相关数据。目前,虽然已有多种算法可以对时序基因表达数据进行聚类分析(如k均值聚类方法、层次聚类方法,基于统计模型的聚类方法等),但这些方法通常把时序基因表达数据看作是普通的多维空间向量,数据中时间上的自关联信息完全被忽视,不能有效影响到聚类的最终结果。
本文研究目的是为了探索新的时序基因表达数据聚类算法,并提出了一组基于自回归模型的动态聚类算法。文中网顾了当前主要的聚类分析技术以及评价聚类效果的评价算法,简要介绍了时序基因表达数据。本论文重点是:(一)建立了一种改进的基于自回归模型和贝叶斯后验概率的动态聚类分析算法,阐述了应用该算法进行时序基因表达数据聚类分析的原理和方法;(二)建立了一种基于自回归模型的模糊动态聚类分析算法,阐述了应用该算法进行时序基因表达数据聚类分析的原理和方法。针对原始动态聚类分析中仪利用类条件概率密度(也称似然度)的问题,根据贝叶斯理论,提出了改进的基于贝叶斯后验概率的聚类算法。同时结合模糊理论,提出了模糊动态聚类分析算法,利用模糊隶属度来调节自回归模型的动态预测过程,克服了原始聚类算法中自回归模型中自回归阶数p=1的局限性。本文最后还利用回归技术对时序基因表达模型做了一些探讨。论文采用MATLAB来编程实现了文中提出的算法,选取了一些数据集来进行实验。实验结果表明,本文提出的方法是有效的、可行的,并且与现有的一些聚类分析方法相比,更为有效。
其他文献
计算机动画是把一系列静态图片有序排列形成连续的动态画面的过程,每一幅图片即是一帧。渲染是把三维几何模型转换为图片的过程,非常的耗时。网格技术的出现和发展,为其高效渲染
平台识别是目标识别的关键技术,针对平台识别具有不确定性和难于进行并行推理的特点,将模糊Petri网的形式化推理方法应用于平台识别,利用它的并行处理能力对平台识别进行高速处
语义网环境的诞生,为信息检索技术开辟了一条新的途径,它可以在知识理解和知识推理的基础上实现对信息资源的准确、全面的检索。用于在语义和知识层面上描述领域概念模型的本体
三值光计算机理论体系是一个很有前景的计算机发展思路。在这个理论体系中,采用光的两个偏振方向相互正交的线偏振态和无光态表达三值信息。本文介绍了国内外光计算机的发展过
可重用设计方法是以IP复用和IP设计为基础的一种有效的设计方法与先进的设计理念,它将传统的停留在板级设计层面的嵌入式系统硬件设计提升到基于可编程逻辑芯片上的系统级设计。可重用设计方法的引入大大缩短了基于可编程逻辑器件的嵌入式系统设计周期,更为科研院所将独创的算法模型迅速转化为IP核,加以推广应用和知识产权保护提供一个良好的途径,成为设计系统原型的首选方式。本文将可重用设计方法成功地应用到实际科研项
序列比对是生物信息学中重要的研究课题,是发现序列的功能,结构和进化信息的重要手段。现有的很多比对算法都是基于目标函数,目标函数利用替换矩阵和空位罚分对比对过程和结
随着科技的日益革新与制造业的发展,调度问题的重要性得到了加强。有许多相关的研究者对于调度问题进行了大量的研究。大部分的研究都是在工件必须被加工这一前提条件下进行的,但是有些情况下可以选择拒绝加工一些工件,本文就是在这一前提条件下进行研究的。调度问题的研究方向有很多。比如车间调度问题,单机调度问题,并行机调度问题。本文主要研究单机调度问题。研究的问题具体如下:给定n个工件,其中每个工件的属性包括:处
在运动捕捉数据检索这一研究领域,大多数工作关注于数据的全局相似性,然而运动捕捉数据的高度复杂性使得这类方法的发展逐渐遇到瓶颈。基于局部相似性的运动捕捉数据检索作为
数字电视机顶盒前端业务信息(Service Information,SI)生成器软件是在符合数据视频广播(Digital Video Broadcasting,DVB)标准13818的前提下,配合SI编辑器软件、数据广播服务
非负矩阵分解算法(NMF)具有不要求信源统计独立、不要求信源为非高斯分布的优点,因而引起了国内外学者的广泛关注。模式表示非负矩阵分解算法(PE-NMF)是对NMF的一种扩展。这