基于CNA的拷贝数显著性检测算法的研究与实现

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:lbj120225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人类各种癌症中,体细胞的拷贝数变异(CNA)是一种常见的基因事件,也是癌症细胞的一种重要特征,它会影响肿瘤的发生和发展。显著的拷贝数变异(SCAs)是指在肿瘤细胞中影响基因组相同区域的、具有显著多发性的CNAs。SCAs被广泛地看成是在癌症的形成和发展中具有“驱动”作用的基因突变,它有助于精确地找到(新)致癌基因和癌症抑制基因,便于为临床上癌症的预防和治疗提供依据。基于CNA的拷贝数显著性检测的目的就是对分段后的拷贝数数据进行显著性检测,从而识别SCAs。本文的研究目标是研究基于CNA的拷贝数显著性检测算法,用Java语言实现各个算法,并对各个算法进行比较。由此本文的主要研究工作如下:  (1)提出了拷贝数显著性检测的整体框架,为拷贝数显著性检测算法的研究提供了一个总体方案。通过分析基于CNA的拷贝数显著性检测算法的基本原理,归纳各个算法的共同且重要的步骤以及每个步骤可以选择的实现方式,提出了基于CNA的拷贝数显著性检测算法的整体框架。  (2)研究并实现了五种典型的基于CNA的拷贝数显著性检测算法,GISTIC、JISTIC、GISTIC2.0、SAIC、RUBIC。分析了各个算法的原理、特征、优缺点以及实现步骤,用Java语言重新实现了GISTIC、JISTIC、SAIC、RUBIC四个算法,并对以上各个算法进行了实测分析比较。  (3)针对SAIC算法在用皮尔森相关系数确定CNA单元时,断点确定上出现的误差问题,参考研究的以上五种典型的算法并结合随机森林中的Bagging算法,对SAIC算法提出了改进,由此提出了新的算法BSAIC,用Java语言实现了这个算法,并在模拟数据和真实数据上验证了其改进的效果。  (4)设计并实现了拷贝数显著性检测的算法工具集,使用这个算法工具集对各个算法进行了分析比较。根据真实数据的特性以及各算法的要求,提出了一个包含16个可调参数的模拟仿真数据集生成算法以及配套的评估标准。对于真实数据,本文选取了RUBIC的官方R代码中公开的样本数据集来测试各个算法,使用RUBIC算法的官方代码的结果为标准对各个算法进行比较分析。通过比较分析,证明了BSAIC算法相对SAIC算法的改进效果显著。
其他文献
由于数字电位器应用越来越广泛,对其分辨率要求越来越高,本文是基于高分辨率、低成本的理念,而提高系统分辨率的分析和研究,进而完成设计。本文的研究是通过设计系统结构,提高板级电路分辨率,主要是用数字电位器芯片、多路选择器芯片和单片机开发板组成系统而实现。数字电位器芯片能够通过接口和单片机接口相连进行设计电路,从而设计实现应用程序控制的调节,同时它也具有按钮控制的方式,都能够达到电位、电阻调节等功能的特
在电子设备中,控制电子元件的工作温度是维持其可靠运行的关键之一。对电子元件集成模块优化布局是降低电子设备温度的一种实用方法。本文提出一种融合模拟退火的离散粒子群
静态随机存储器SRAM和乘法器作为嵌入式CPU中最主要的两个功能模块,早已成为现代数字集成电路设计领域的研究热点。随着集成电路制造工艺进入纳米级别和市场对产品要求越来越
随着计算机技术的飞速发展和医疗领域对虚拟现实技术的需求增加,该技术走向广泛应用的时代已经到来.我院根据临床医疗工作需求,从2004年开始研究采用虚拟现实技术在临床医疗中开展相关测试和手术教学试验,应用于手术培训、手术预演、f临床诊断、远程干预、医学辅助教学等环节,给医院带来实实在在的回报,获得了良好的效果。
零件表面的加工质量直接影响着其性能的好坏。随着科技的不断发展,光学、电子、机械行业对表面加工的要求也越来越高,所以对零件表面微观形貌进行高精度检测就更为迫切。  
采用新的均匀三点中心约束多矩有限体积方法(3-point Multi-moment Constrained finite-Volume scheme for Uniform Points with Center Constraints,MCV3_UPCC),发展了一个
随着电子、通讯和网络技术的迅猛发展,电力电子技术近年来得到了广泛的应发展。本论文结合所在课题组的嵌入式开发板项目,依照开发板各路最大供电电流须满足1A的电气要求,并考虑电源电路的实用性与简便性,主要研究了带功率因数校正的AC-DC多路输出型正负式开关稳压电源。为了方便电路整体结构的设计,按照电路各模块实现功能的不同,整个电源划分为三部分,即有源功率因数校正部分(APFC)、反激直流变换电路和线性稳