基于数据融合的共调控基因挖掘方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xiaoping123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是生命科学和信息技术的世纪,共调控基因挖掘是生物学家在基因功能关联领域研究工作的核心之一。DNA微阵列芯片的发展使作为生物信息学数据源的表达水平数据已经能够通过生物学实验海量提取。利用这些数据分析调控因子如何对若干基因进行表达调控,可以构建基因调控网络,而构建基因调控网络是挖掘共调控基因的主要任务之一。共调控基因指的是一组基因的集合,这组基因在生物细胞中被相同调控因子进行调控,控制其在转录或翻译阶段的表达,进而影响细胞执行其相应功能。构建基因调控网络并挖掘其中的共调控基因,可以从分子水平上理解生物体的生理活动和功能,了解生物体如何根据基因的不同表达而产生的变化。从表达水平数据中计算共表达团,得到转录调控模块是目前普遍使用的挖掘共调控基因的方法。然而大部分共调控基因不仅在表达水平上具有相似模式,而且在生命体的某一过程当中具有相似功能,所以同时利用表达水平数据与本体数据来挖掘共调控基因,能够更准确地分析和发现基因间的共调控关系。本文针对共调控基因的挖掘,分别从表达谱相似性、本体相似性与综合网络集中频繁稠密子图挖掘三个方面进行了研究:(1)通过对共调控基因在表达谱中的表达相关性进行研究,定义了一种基于子空间搜索的基因表达谱相似度计算方法。首先搜索基因的样本空间,找出待搜索基因的相关空间,其次计算此相关子空间上基因表达水平的相似性,从而解决了共调控基因相似性计算中的正反共调控和部分时间共调控的发掘问题。(2)由于基因本体(Gene Ontology, GO)能够更统一高效地注释基因产物,所以利用它提供的丰富信息来预测基因之间的功能关联。通过对基因本体结构进行分析研究,提出一种基于语义分化的基因本体语义相似性度量方法。本方法引入了语义分化因子与最短路径的概念,对每个术语所含有的信息量重新定义,使每个术语在GO图中拥有固定的信息量,并采用节点的子孙节点的个数比来定义边的语义分化因子。该方法融合了节点之间的信息量与路径双重语义,充分考虑了术语在GO拓扑结构上的位置信息,更能够反应生物体之间的关系。(3)提出一种基于数据融合共调控网络的共调控基因挖掘方法。该方法首先对表达谱数据与本体数据的相似性度量结果进行筛选,得到一个“共调控网络集合”,然后利用图论中的频繁稠密点集挖掘方法,从中挖掘出所需的共调控基因组。结果表明,此方法所得出的共调控基因组被同一调控因子调控的比例远高于单独使用一种数据源进行挖掘的方法,具有很好的应用潜力。
其他文献
自从计算机诞生以来,计算机硬件故障和软件错误就不可避免地伴随着。在云计算环境下计算机硬件和软件环境更为复杂,随着处理机数量的增加,故障发生的概率与恢复难度也会随之增加
传统伤口评估需要临床医师凭借经验对伤口使用毫米尺等工具进行手动测量大小和视觉观察给出伤病级别、感染等伤口状态评估,因其较低效率占用了海量医疗资源。多光谱图像可获
灵敏性分析是研究改变参数的值及其传播过程,考察参数变化对于目标对象所产生的影响,从而对系统参数和结构的重要性进行量化分析,在系统的特性分析和异常特征发现方面有着广泛的
随着计算机网络技术的快速发展以及数据库、数据仓库等数据仓储技术在管理信息系统中日益广泛的应用,互联网上的信息迅猛增长,海量数据不断产生,Web逐渐成为人们进行资源获取与
当前本体已广泛应用于语义网、电子政务、数据挖掘等传统领域,且正逐渐扩展至云计算、物联网等新兴学科中。本体的构建工作是其应用研究的基础工作,但目前尚无统一标准,而人工构
压缩感知作为一种新颖的信号获取理论,自提出以来,迅速在众多领域引起了高度的关注。有趣的是,压缩感知框架可以被看作一种加密方案。与传统加密方案相比,压缩感知加密方案具
无线自组织网是由一组带有无线收发装置的移动节点组成的一种无线移动通信网络,它不依赖于固定的基础设施,网络中的节点利用自身的无线收发设备交换信息。它具有无中心、自组织
随着网民人数的不断增多,可分配IPv4地址面临枯竭,使用下一代互联网协议IPv6替代IPv4是解决地址不足问题的根本方法。但是协议升级不可能在短时间内完成,因此IPv4向IPv6过渡技术
多包接收技术可以同时接收多份数据包,减少信道冲突,提高无线网络的吞吐量,近年来成为无线网络的研究热点,本文在分析多包接收物理层实现技术的基础上,通过调节节点发射功率,采用跨
虚拟现实技术一直是计算机图形学领域的研究热点之一,而三维模型作为事物在虚拟世界中的表现形式,场景的快速生成一直被人们所重视。植物是常见的自然景观,其自身的复杂性决定了