基于深度学习的基因组结构变异检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ericli2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在针对不同类型基因组变异识别任务中,大片段结构变异具有种类多样、成因复杂、识别困难等特性,现有传统方法得到的结果普遍准确率欠优。鉴于深度学习在高通量基因组组学领域的可期前景,本文引入深度学习相关技术研究具有高准确率的结构变异过滤方法。本文的主要研究内容包括:(1)提出了结合多重典型结构变异特征的结构变异图像编码方法,并定义了具有针对性的绘制规则、拼接规则和缩放方法,经实验证明能有效修正结构变异数据的非直观性,有效用于后续结构变异过滤。(2)提出了一种基于图像分类原理的基因组结构变异过滤方法,该方法利用六种不同的分类网络模型,包括大型的Image Net-based网络模型和轻量级网络模型,并根据模型特点分别进行网络细节调整。通过使用加权训练方法,能够在不影响泛化能力的基础上有效减少模型震荡,加速网络训练达到收敛。经对比实验证明该方法能够有效实现结构变异过滤。(3)提出了一种基于目标分割原理的基因组结构变异过滤方法,该方法基于Two-Stage框架进行多任务过滤,同时利用结构变异图像编码过程的中间信息,实现实时性的Mask掩膜标注。经实验证明该方法能够实现较好的结构变异过滤效果及较高碱基覆盖区域的判定精度。
其他文献
交通街景作为一种全新的地图服务方式,从推出以来就被给予很高的期望和广泛的关注。交通街景真正实现了“人视角”,为用户提供更加真实、更加丰富的细节地图服务。交通街景中
在电源出厂前,电子负载通过控制被试电源端口的连续型或断续型电流来模拟实际负载,完成电源的加载测试,在此同时,能馈型电子负载系统还可以将电能回馈给电网,属于一种新型电
知识图谱是客观世界信息的结构化表示,应用非常广泛,围绕知识图谱的问题与应用有很多相关的任务。知识图谱补全,又称为链接预测,旨在预测知识图谱中缺失的边;路径查询回答旨
目前我国研制旋压设备的流程为概念设计、总体设计、技术设计、物理样机试制直至正式生产,按该流程生产的设备难以满足低成本、高效率的现代制造需求。虚拟样机技术作为一种
农业机械购置补贴政策实施有效助推了我国主要粮食作物耕种收环节的农业机械化普及。但与此同时,农业机械化在南北地区、不同农作物、不同环节发展不均衡现象日益凸显。近两年来,部分丘陵山区县(市)农机购补资金使用量呈断崖式下跌,农机“产品少、住房少、行路难、看病难”的问题依然困扰着丘陵山区农机化发展,这些问题都对农机管理部门和生产行业提出了更高要求。因此,必须推进“农机农艺相结合、机械化与信息化相融合、农机
随着人类活动愈加频繁和城市化进程不断加快,水体富营养化已经成为困扰全世界的主要环境问题之一。水体一旦发生富营养化,不仅会给生态环境造成持久性的危害,也会给社会经济
自然界中多糖广泛存在,例如纤维素、甲壳素、壳聚糖等,将其制备成环境友好型材料已成为当今研究热点。在本工作中,根据纤维素和甲壳素的结构特点,用合理的方法将它们水解成纤
无线传感器网络集传感器、网络、无线通信和嵌入式计算于一身,是一种新型的信息获取和处理技术。网络中节点体积小、重量轻的特点使得网络可被灵活的应用在对复杂环境信息的
安全性是通信网络的基石,也是衡量通信系统性能的重要指标。与传统的通信网络相比,电力线载波通信网络面临更加严峻的安全威胁。传统的加解密算法和上层安全协议无法满足人们
随着煤矿的开采逐渐向深部进行,对于深部软弱煤岩的破碎变形分析以及合理支护问题变的尤为重要。为了选择合理支护及其布置来保持深部软弱煤岩巷道的稳定,为解决深部软弱煤岩