【摘 要】
:
核苷酸单位点变异(SNV,single nucleotide variants)在各种类型的人类癌症中的细胞增殖和肿瘤发生中起重要作用。而基因突变也被认为是癌症的发生与发展的根本原因,核苷酸单位点的变异又基本分为两大类:种系变异和体细胞变异。其中种系变异主要可能与一些遗传疾病相关,而体细胞变异主要涉及到后边癌症的发展。所以对基因组中SNV的准确检测对医学方面癌症问题的预防及攻克上提供了全新的思路。
论文部分内容阅读
核苷酸单位点变异(SNV,single nucleotide variants)在各种类型的人类癌症中的细胞增殖和肿瘤发生中起重要作用。而基因突变也被认为是癌症的发生与发展的根本原因,核苷酸单位点的变异又基本分为两大类:种系变异和体细胞变异。其中种系变异主要可能与一些遗传疾病相关,而体细胞变异主要涉及到后边癌症的发展。所以对基因组中SNV的准确检测对医学方面癌症问题的预防及攻克上提供了全新的思路。随着新一代测序技术(NGS)的发展与逐渐成熟,测序速度与成本得到空前提升,我们可以轻松获得大量高通量的测序数据,这对我们预测SNV起到了关键作用。当前,存在许多用于从NGS数据中发现种系或体细胞SNV的计算方法,但是很少有足够的通用性来适应任何情况。例如目前市面上,大都数主流的方法还是需要参考序列、正常匹配样本和肿瘤匹配样本来进行的体细胞SNV的检测,在没有匹配的正常样本的情况下,从单肿瘤样本中预测体细胞SNV变得非常具有挑战性,尤其是当肿瘤纯度未知时,检测SNV的方法的性能更是参差不齐。在这里,我们提出了一种新的方法STIC来预测体细胞SNV,并根据NGS数据估算肿瘤纯度,更重要的是无需匹配正常样品,只需要肿瘤样本即可。除此之外,当前的主流方法大都还是通过数学公式和贝叶斯理论算出一个阈值,而我们的STIC则是采用的神经网络的方法,更具有一定的先进性。STIC的主要特征包括:(1)首先对数据进行预处理得到pileup格式的文件,通过pileup文件中包含的基因位点等信息,对每个位点上提取一组与SNV相关的19个特征,其中包括碱基覆盖数、碱基质量和正链匹配的数量等。然后使用这些特征通过Tensor Flow框架训练BP神经网络模型以预测SNV;(2)通过干扰等位基因频率,创建一个区分体细胞SNV和种系SNV的迭代过程;(3)建立肿瘤纯度与体细胞SNV等位基因频率之间的合理关系,通过频率与频数计算的平均值以准确估计纯度。为了验证STIC对体细胞SNV检测的实际性能,我们定量评估了STIC在仿真数据和真实数据的结果,并将取得的结果同另外五种主流方法做了对比。仿真数据的结果显示,STIC于低肿瘤纯度下在灵敏度、准确度以及F1分数的衡量下具有最优的综合性能。真实数据的结果显示,STIC在检测数量和准确度方面也是优于其他四种方法。对于仿真数据肿瘤纯度的估算,由于其他方法没有提供该功能,我们只能与真实纯度相比较,其结果也是基本吻合的。所以说,STIC具有较好的检测能力。
其他文献
视紫红质广泛存在于各种脊椎动物的眼睛中,介导脊椎动物暗视觉,即在光线较暗的地方,辨别不出物体的颜色,但是可以看出物体的形状。脊椎动物早期生活环境相似,在浅水区域生活。但是现生物种生活环境不同,这会促使机体对环境产生适应性变化,导致视紫红质功能发生改变。现目前可采用两种实验手段对视紫红质的功能从两个层面上进行研究,一种是用光谱法,研究视紫红质可见光范围即最大吸收峰值;另一种是用非光谱法,测量曝光后的
在小学阶段,叙事性作文的真实性一直备受关注。事实上,作文即做人,引导学生在习作中叙写真实素材和抒发真情实感还可以培养学生诚实的品格。但当下,小学生的叙事性作文中经常会出现编造习作素材和表达虚假情感等现象,这需要我们深入研究。本文采用文献研究法、访谈法和问卷法对真实性习作的文献进行梳理和分析,并将锦州市三所小学的语文教师和三、四、五、六年级的小学生作为研究对象,对当前小学生叙事性作文的真实性习作问题
目的:1.建立一种稳定、成功率高的显微镜下大鼠68%肝切除+肝双重动脉血供(liver dual arterial blood supply,LDABS)的动物模型。2.在动物模型基础上,分离肝脏线粒体,阐述肝双重动脉血供对肝脏线粒体能量代谢的影响。方法:1.纳入研究大鼠76只,分为训练组(40只)、造模组(36只)。训练组模拟手术操作,优化围手术期管理;模型组行显微镜下制备大鼠68%肝切除(肝左
儿童是祖国的未来。安全是儿童生存的最重要保障,是儿童最基本的权利之一。长期以来,留守儿童和流动儿童的安全问题受到社会各界的广泛关注。然而,城市儿童同样也面临着各种安全问题,比如交通意外、走失、烧伤、烫伤、摔倒、校园欺凌等,轻者威胁健康,重者导致死亡。因此急切地需要运用社会工作专业理论和方法对城市儿童开展安全教育。本文重点探讨了“城市儿童安全教育的社会工作介入”这一问题,希望运用社会工作的专业理论和
混剪视频是近年来依托用户生成内容蓬勃发展的一种视频类型,与其他视频不同的是,混剪视频是一种对版权作品进行二次制作的结果。在数字网络环境中,大众可以轻而易举的对版权作品进行复制和使用,然而获得权利人许可的却少之又少。混剪视频大量使用版权作品,但使用的合理性却屡屡遭到诟病,这已经成为伴随其蓬勃发展的致命困境。理论界对此有两种截然不同的态度,一种是有力遏制,另一种是鼓励在一定条件下发展。然而司法实务界目
“X到没朋友”是现代汉语常用构式,由变量“X”、常量“到”“没朋友”构成。构式构件“X”可由大部分性质形容词充当,部分动词和名词本身具有一定程度性,通过构式压制进一步虚化后也可进入构式。变量“X”多为单音节词,双音节词占少数。除部分具有性质形容词特性的词组可以进入构式外,其他多音节或重叠式词和词组均不可进入构式。[+程度性]是“X”进入“X到没朋友”构式的语义条件。“X到没朋友”构式义为说话人对某
近些年来,随着云计算、大数据技术的飞速发展,应对不同的应用需求和硬件环境,软件系统设置了许多可配置的参数和大量可供选择的工作负载。但是,对于绝大多数的软件系统使用者来说,设置这些软件系统参数和选择不同的工作负载来提高软件系统的性能是不可能做到的。虽然我们可以获得一些能够提升软件系统性能的优化方法,但是绝大多数方法的训练样本数量都是巨大的,对于样本数量少、优化时间一定的情况下的效果并不理想。所以,当
如今,城市人口的癌症发病率受城市污染、压力增加、人口老龄化进程加快等诸多社会因素的影响而日渐高升,癌症在因病而死中占据主要地位,是城市居民死亡的首要原因。据世界卫
企业并购己有一百多年的历史。并购是企业获得资源优势、赢得市场地位的重要方式之一。由贝恩公司发布的《2018全球并购市场年度报告》显示,全球并购规模正在以17%以上的速度在增长。在并购交易如此火热的背景下,国内外的许多学者普遍得出结论:并购能为目标方带来超额收益,但会给并购方造成损失,并购方的并购绩效表现并不理想。我们梳理了学者们关于这一问题的看法,大多数观点都与信息不对称理论相关。鉴于国内外学者就
互联网技术的发展给人们的生活带来了极大的便利,但与此同时潜在的网络安全问题给人们的工作、生活埋下了巨大的隐患。基于日志数据进行安全审计,可以有效降低网络安全风险。传统针对日志数据进行的安全审计,多采用离线处理方式,该方式使用大数据手段对大量日志进行批处理,实时性差。针对上述问题,论文搭建了基于URL的安全审计模型,构建起了一条完整的实时安全审计链路。在此基础上,完成了基于实时计算的安全审计系统的研