癌症共调控网络中功能模块挖掘算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:shenyang0623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着DNA微阵列技术、高通量测序技术的不断延伸和迅猛发展,产生了许多的基因表达谱数据、分子相互作用数据、基因组数据。这些数据在研究基因突变、基因识别、基因分型和癌症分型诊断等方面有着重要的实用价值。同时,由这些数据组成的基因调控网络也为从网络层次上探索生物基因关系提供了支撑条件,对癌症共调控网络的研究也有助于理解癌细胞组织内部致癌基因的产生过程和基因分子之间的调控关系。本文针对癌症共调控网络,基于miRNA/TF/mRNA表达谱数据集,提出了两种共调控功能模块识别算法。首先,传统的生物功能模块识别算法忽略了关键调控因子可能参与到多种生理过程中所形成的重叠性问题,本文提出了一种基于重叠谱聚类的共调控模块挖掘算法OSC(Overlapping Spetral Clustering)。该算法首先在使用皮尔逊相关系数分析的基础之上,应用经验贝叶斯理论构造准确度较高的共调控相互作用网络。其次使用特征间隙方法自动确定识别出的最佳聚类数目,避免人工设定阈值的弊端,保证整个算法框架的自适应性。然后使用凝聚式分层谱聚类方法得到非重叠的功能模块。最后提出目标重叠度函数对跨越不同模块的边进行重叠判断,根据最大内部聚集、最小外部连接准则挖掘出重叠性的共调控功能模块。实验结果表明,相比于与NJW、SNMNMF算法,OSC能够发现更多miRNA/TF/mRNA之间的协同调控作用,并且挖掘到的共调控功能模块具备更加显著的功能富集意义。其次,随着基因表达谱数据规模逐渐增加,普通模块识别算法在运行过程中存在搜索空间大、运行时间长的问题,本文提出了一种基于爆炸搜索策略的模块识别算法RMCL-ESA(Regularized Markov Cluster&Explosion Search Algorithm)。该算法首先采用改进马尔科夫过程对基因表达谱数据集进行预处理,通过扩展、膨胀、修剪三个子过程对网络中的节点进行过滤。该过程能够使网络中强连接更强,弱连接更弱,并删除冗余基因,使得后续的运算处理过程更加迅速,节约存储空间。然后基于miRNA和转录因子对靶基因的特殊调控模式,采用两阶段的爆炸搜索方式进行模块识别。在第一阶段,在全局搜索空间内寻找能够作为烟花弹的节点中心簇;在第二阶段,向中心簇的邻域靶基因贪婪搜索,寻找满足适应度函数的功能模块。经过实验,相比于与NJW、SNMNMF算法,RMCL-ESA算法得到的功能模块包含更多显著生物功能和调控通路。同时,通过对GOES和KEGGES富集分值进行累计经验分布分析、结合患者临床样本对模块进行生存分析,发现RMCL-ESA算法能够挖掘到大量包含较高富集程度的共调控模块,且在OVCA数据集中能够显著的将病患区域分开,具备显著生物意义。
其他文献
近二十年来,有机电致发光器件(OLED)由于其视角宽、节省能源、材料来源多且环保、质量轻薄、可制备大尺寸柔性弯折显示等众多的突出优点,引起了学术界与制造界的高度重视,被
随着神经网络理论的提出及其不断发展,它已经给人类的科学技术,及其对自然的认知带来了很大的影响。忆阻器是除了电感器、电阻器、电容器之外的四种基本无源电子元件之一,是
无线传感器网络已广泛应用于军事、医疗、环境监测等多个领域。两层传感器网络作为传统无线传感器网络的延伸和发展,因其良好的可扩展性、有效的能耗和空间节省、高效的查询
集成电路规模的飞速增长,使得集成电路功能复杂度日益提升,一方面为信息技术产业带来了生机和活力,另一方面也产生了许多问题和挑战。集成电路的功能正确性是这些问题和挑战
计算机I/O总线连接丰富的各类I/O设备,是实现计算机I/O连接及外部扩展的关键技术。随着I/O设备性能的持续攀升,计算机系统总线已从传统的ISA、PCI等共享介质总线发展至基于点
嵌入式系统是一种专用的计算机系统,通过裁剪、结合软硬件的资源,可以满足用户各项性能指标的要求,包括功能需求、可靠性、成本、能耗、体积等等。在嵌入式系统设备中,有一种
近距离场景下的语音识别已经达到了令人满意的结果,但是由于受到噪声和混响等因素的影响,远距离场景下的语音识别依然具有很大的挑战性。和单路麦克风相比,麦克风阵列波束形
随着存储着海量数据的分布式文件系统的进一步发展,为了满足各种企业、学术机构等组织对数据存取速度的需求,诞生了内存分布式文件系统这一概念。以开源的Alluxio为代表的内
智能手机等移动设备为访问信息和使用计算资源提供了极大的便利,但是,受限于自身的尺寸、大容量电池制造技术的滞后、无线通信网络不稳定等因素,使其越来越无法满足移动用户
近年来,云计算、IPTV和4K/8K高清电视等高速服务的快速发展进一步提高了对于接入网带宽的要求。目前在无源光网络(Passive Optical Network,PON)中,强度调制/直接检测(Intensity