基于新一代测序数据的肿瘤体细胞突变检测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:allenhuqiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
检测与各类疾病相关的变异是进行基因组序列分析的主要目标之一,随着新一代测序技术的成熟和广泛应用,科研人员可以在短时间内获得大量的基因组序列信息进行变异检测工作。近年来,随着精准医疗和癌症靶向治疗理念的提出,越来越多的科研人员投身于致癌基因的探索与研究中。本文提出了一种新的体细胞变异检测方法:svm Somatic,它考虑了拷贝数变异对体细胞变异检测的影响,使用支持向量机作为分类器,可以在单样本数据下完成体细胞变异的检测工作。本文主要工作和创新点如下:1.本文把拷贝数变异对体细胞变异检测的影响加入考虑。传统的体细胞变异检测方法往往是根据单一变异进行考虑,这种情况下,等位基因频率就是检测体细胞变异非常重要的一个指标。在理想情况下,等位基因频率可以很好的区分出种系变异和体细胞变异。但是在实际的肿瘤细胞中,情况是复杂多变的,比如肿瘤异质性、同时存在于肿瘤细胞内的拷贝数变异、小片段的插入删除等,这些因素都会让等位基因频率偏离理想情况。svm Somatic在进行体细胞变异和种系变异的区分时,把拷贝数变异纳入考虑,这不仅可以降低其他变异对体细胞变异检测的影响,而且让本文研究方法更适用于肿瘤细胞内的实际情况。2.本文采用单样本的方法实现了体细胞变异的检测。在临床医学中,配对样本非常难获得,一方面的原因是在进行样品收集的时候没有考虑到后续使用的需要,所以没有第一时间进行配对样本的收集。另外,配对样本的获取也需要患者的同意才可以进行,有的患者为了自身隐私拒绝提供配对样本。还有一个原因是出于对成本的考虑,虽然新一代测序技术的出现使得测序成本大大降低,但是肿瘤基因组和正常基因组都进行测序的话,仍然是一个很大的开销。除此之外,还需要增加数据存储和计算需求,这些在无形中都增加了配对样本的获取成本。因此,svm Somatic进行单样本体细胞变异的检测不仅可以解决配对样本获取困难的问题,还可以减少测序成本以及数据存储和计算成本。3.本文采用改进的支持向量机进行体细胞变异和种系变异的分类工作。首先提取了五个与体细胞变异有关的特征,之后根据仿真数据加入标签进行训练,训练过程采用10-折交叉验证以寻找最优分类模型。为了提高支持向量机在海量数据中的模型训练速度,采用边缘检测和K-means聚类方法重构训练集,降低训练集的数据量,从而达到提高模型训练速度的目的。最后在仿真数据和真实数据上进行实验,为评价svm Somatic性能,选择了四种经典方法作为比较,结果显示svm Somatic在体细胞变异检测上具有较好的效果。
其他文献
在翻译工作中,译者必须对原文中使用的词汇、句法进行准确的把握,本着语义和句法功能对等的原则,对译语进行选择。如此才能使译文读者获得与原文读者相同的信息,真正实现等效翻译。本文基于上述原则,结合笔译实践文本中出现的具体实例,对于复合格助词“として”的汉译方法进行了分析与总结。“として”作为复合格助词,用法十分广泛。既可以单独接在体言后使用,也可以与其他助词(如格助词“の”、系助词“は”、“も”等)一
科普文的翻译和传播对于各国提高教育水平、促进科技进步均起到重要作用。而科普文本不仅涉及大量科学术语,还需要译者理解各学科知识、复杂文本的特征、多样的修辞手法。这对译者的知识素养、文字水平、翻译功底都提出了较高要求。要想解决这些问题,使译文为传播科学知识服务,就有必要选择合适的理论对翻译实践进行科学指导。没有适用于所有文本的万能翻译方法。我们需要根据文本的特点制定相应的翻译策略。此时,赖斯倡导的文本
太赫兹贝塞尔涡旋波束具有众多优良特性,它结合了太赫兹辐射的宽光谱带宽、良好穿透性,和贝塞尔涡旋波束的无衍射特性、自愈合特性以及携带轨道角动量的能力,在光镊、成像、量子纠缠和通信等领域有了广泛的应用。然而在实际的通信和成像等应用中,必须考虑环境对波束传播特性的影响。本文主要基于贝塞尔涡旋波束的圆柱矢量波函数展开,并结合边界条件,推导得到了贝塞尔涡旋波束在单/多层磁化等离子体介质中的反射和透射场。对于
德国功能翻译学派于20世纪70年代产生,是注重翻译功能的一种翻译流派,其核心思想为目的论,强调翻译的目的在翻译过程中具有决定性作用。在本次翻译实践当中,笔者基于目的论及相关先行研究状况,着眼于文学翻译的目的性,同时结合笔者本次翻译实践对象文本《三则插话》的特点,说明了目的论用于指导翻译实践的可能性,并通过具体例子分析了如何在目的论三原则的指导下选择合适的翻译策略,以解决翻译过程中出现的问题。目的原
在我国的传统文化之中,孝道居于核心地位。在孝道文化中,敬养和关爱老人是其重要内容。从古至今,孝道理念都与法律体系有良好的互动融合,我国对孝道理念融入中国特色社会主义法律体系也做了许多有益的实践,来保障老年人权利,督促人们严格履行尽孝义务。笔者希望通过这篇文章对当下中国孝道纠纷的意义进行论述,分析涉孝纠纷在司法审判实践中存在的问题并分析其背后原因,在这样的基础之上提出一些具有可行性的解决涉孝纠纷难题
企业员工健康服务管理系统是企业日常生产管理流程中对员工健康服务管理信息化的核心部分,员工健康服务管理系统管理工作内容繁杂、涉及对象多;随着数字化转型的要求,对工作流程效率和数字化要求的不断提高,使传统的员工健康服务管理的弊端日益凸显,因此设计一个智能化、数字化的员工健康服务系统,改善企业对员工的健康服务管理效率,优化流程,提高生产和办公效率成为企业员工健康管理数字化的当务之急。根据当前的发展形势,
随着器件特征尺寸的不断减小、芯片集成度的不断提高,超越摩尔定律成为了集成电路行业的发展趋势。在此趋势下,三维集成技术和TSV技术应运而生,成为实现三维微系统的关键技术途径。但是随着三维微系统集成度和功率密度的提高,对电学特性、热特性、应力可靠性等方面带来了诸多的挑战,因此同时考察电设计、热管理与应力的多场耦合分析势在必行。并且随着微系统尺寸的缩小,对封装级的三维微系统进行有限元数值仿真的复杂度也会
变化检测(Change Detection,CD)是通过对同一场景在不同时间获取的两幅或者多幅遥感图像进行对比,分析图像间的差异,从而获得所需的变化信息。合成孔径雷达(Synthetic Aperture Radar,SAR)是遥感技术中比较常见的获取遥感图像的方式,利用合成孔径原理实现高分辨的微波成像,不受天气等外界条件影响,可以全天候、全天时工作,因此SAR图像变化检测成为研究的热点。随着研究
深度学习的出现使得计算机视觉得到了蓬勃的发展,而目标检测作为计算机视觉中最为基础的任务,已经在自动驾驶、智能监控、智慧医疗等各个领域中得到广泛的应用。近年来随着社交媒体网络和移动/嵌入式设备的普及,使得视频和图像数据量急剧增长,进而导致了对视觉数据分析的需求不断增加,如何兼顾算法的速度与准确度的平衡,尤其是实现适用于移动低端GPU设备的实时目标检测算法成为当前研究的热点。本文在实时目标检测算法YO
地震灾害严重影响到输电线路的安全稳定运行,对于特高压直流输电线路,因其线路总里程长,途经区域地形复杂,跨越地震带多,且特高压直流输电塔的柔度更大,因此受地震灾害的威胁更加严重。已有研究多集中于交流输电线路的地震响应分析,且地形条件对输电线路地震响应的影响研究较少。针对上述问题,本文先讨论了目前输电线路抗震分析的前沿动态;然后以滇西北特高压直流输电线路工程为研究对象,选取位于地震高发区的一段线路,建