DNA存储碱基插入删节信道模型与编码技术研究

来源 :王盼盼 | 被引量 : 0次 | 上传用户:huishouzhong2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全球数据量的持续增长给传统的数据存储介质带来了巨大挑战。DNA作为天然的遗传信息存储介质,具有存储密度高、保存年限长和能耗低等优点,成为很有潜力的新型数据存储介质。然而,由于DNA合成、储存、样本扩增和测序过程中引入的插入、删节和替代错误,会导致DNA序列错误译码,无法正常恢复数据。其中,DNA序列中的长均聚物容易引起难以处理的插入和删节错误,并且造成合成困难。因此,本文针对DNA信息存储中长均聚物引起插入和删节问题,提出了一种基于分组多碱基旋转编码的级联码方案。并针对DNA信息存储所需的生化技术存在成本高、耗时长、实验复杂等诸多问题,设计了相匹配的仿真平台来对编译码方案进行验证。具体工作包括:一方面,为减少长均聚物从而降低插入与删节发生的概率,提出一种分组多碱基旋转编码结合RS码的反转级联码策略。具体地,将信息序列以两个碱基为单元进行旋转编码,完全避免了长度在4以上的均聚物;改变了先进行纠错编码再进行旋转编码的策略,仅对信息序列进行旋转编码,有效避免错误传播,保证数据恢复的可靠性。所提出的方案将旋转编码的效率从最高80%提高到了96.88%,同时避免了错误传播。实验表明:在相同的可靠性条件下,4000条寡核苷酸序列相比于传统方法多存储31.6%的数据;存储相同的数据量,仅需要2×的测序数据即可恢复原始数据,而传统方法需要3.6×的测序数据。另一方面,为验证DNA信息存储编译码方案的可靠性并优化系统参数,开发了一个基于模块化的全流程仿真平台,主要由文件编码模块、测序数据仿真模块、数据恢复模块和数据分析模块四部分组成。仿真平台首先将需要存储的文件根据不同的编码方案映射为DNA序列;然后对测序信道进行建模,基于统计特性仿真测序数据;最后将仿真读段进行数据恢复流程,完成数据的无差错恢复。同时,仿真平台可以分析数据的特征和仿真测序数据的性能,对整个恢复流程有一定指导作用。仿真结果表明,本文搭建的全流程仿真平台可在一定程度上模拟DNA信息存储的主要操作,为新的编译码方法的研究提供支持。
其他文献
学位
学位
目的:探究与平原地形条件对比下,高原地区对我国士兵体能的影响。其意义在于剖析士兵在高原地形下所欠缺的能力,提高我军部队在高原时期士兵的体能,辅助我军在极端环境与地形下的训练,最终提高士兵整体战斗力。方法:本文主要采用测试法。以驻扎新疆,西藏某地的士兵为研究测试对象。根据美军新出台的士兵体能测试方法进行合理的修改,确定本研究测试指标为12项坐位体前屈、体脂肪、最大摄氧量、屈腿硬拉、直腿硬拉、立定跳、
本文采用文献资料法、录像观察法、数据统计法等研究方法,以西蒙娜·哈勒普红土单打比赛技战术特点为研究对象,从横向和纵向的角度对2012-2019年西蒙娜·哈勒普参加的21场红土比赛进行研究。利用“三段论”的结构框架,分析西蒙娜·哈勒普在发球阶段、接发球阶段、相持阶段,面对不同选手所表现出来的各项技战术指标的总体发挥情况,以及在这三个阶段的关键分当中其所使用的技战术情况。从而为我国女子职业网球运动员在
2019年全国出台《体育强国建设纲要》,越来越多的人们参与到不同形式的体育活动中,田径运动中的马拉松项目由于符合大众参与度高且运动门槛低的特点逐渐成为当下最流行的运动方式之一。半程马拉松是马拉松项目中的一个分项,同属于长距离耐力项目,是马拉松比赛中受欢迎度最高,参与人数最多的一项运动。本研究通过查阅国内外有关马拉松训练、间歇训练理论相关的文献资料,在掌握一定训练理论的基础上,期望为男性业余半程马拉
课题组以乡村振兴视阈下日照市农村普惠金融发展水平为主要研究对象,通过层次分析法和变异系数法建立模型,采用理论分析与实证研究相结合的方法,结合相关文献研究成果及日照市实际情况,从农村金融服务的可获得性、农村金融服务的规模、农村金融服务的质量、数字普惠金融发展水平4个维度和22个具体指标构建日照市农村普惠金融评价指标体系。同时通过农村普惠金融指数(RIFI)对2016—2020年日照市整体及各区县农村
邵雅琪是我国女子佩剑国家队优秀运动员,当前世界积分排名第六位,是东京奥运会的主力运动员。奥尔加·卡兰是世界优秀女子佩剑运动员,当前世界积分排名第一位,选取两人2019-2020赛季上半年共23场国际比赛录像(邵雅琪12场、奥尔加·卡兰11场),采用文献资料法、专家访谈法、录像分析法、数理统计法、对比分析法等研究方法,从技战术分析和性能分析两种分析视角对两人进行单独和对比分析,找出邵雅琪与奥尔加·卡
通过大数据与人工智能对体能训练进行“赋能”是解决中国缺乏高水平教练员与科研人员问题的重要途径之一。同时,在我国引进新的训练方法时如何帮助我国基层教练员与体能教练合理的应用这些训练手段也是我国急需解决的课题。本研究以动态不确定因果图(DUCG)在羽毛球男子运动员体能训练方案推荐的应用为研究对象,旨在探索人工智能与体能训练的融合,以达到帮助教练员与体能教练进行体能训练方案制定的目的。以男子羽毛球项目为
研究目的:将复合式训练与抗阻训练和快速伸缩复合训练进行对比,加强实际探索,以期寻找和验证适合足球运动员提升爆发力的训练方法,为实际训练提供参考。方法:以北京体育大学女子足球代表队24名队员为实验对象,分为复合式训练组(CT组,n=8)、抗阻训练组(RT组,n=8)和快速伸缩复合训练组(PT组,n=8),共进行6周实验干预训练。在实验前后分别进行纵跳测试(SJ蹲跳和CMJ下蹲跳)、立定跳远测试(双脚
2022年,党的二十大报告指出全面推进乡村振兴。数字普惠金融服务将赋能于农村地区,使金融服务产品和服务更好地进入乡村、服务农民,是实施乡村振兴战略的重要手段。但数字普惠金融在乡村的发展面临着缺乏完善的治理机制、数字金融信任度低、金融风险挑战升级等现实窘境,严重阻碍了数字普惠金融的深入推广。文章阐述了数字普惠金融对乡村振兴的支持作用,及制约发展农村数字普惠金融的因素,提出了数字普惠金融助力陕西省乡村