基于纠错编码理论的DNA序列编码特性分析

来源 :重庆大学 | 被引量 : 0次 | 上传用户：Yeah12345678

【摘要】

：

现代生物学的研究不再是单一学科的研究,而是多学科交叉、综合的研究。由于生物系统自身的复杂性,需要将多种分析理论和研究方法应用到该领域。随着基因工程所获得的基因数据

【作者】

：

刘晓

【出处】

：

重庆大学

【发表日期】

：

2004年期

【关键词】

：

纠错编码遗传信息 DNA序列简并性短程关联占优

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现代生物学的研究不再是单一学科的研究,而是多学科交叉、综合的研究。由于生物系统自身的复杂性,需要将多种分析理论和研究方法应用到该领域。随着基因工程所获得的基因数据的急速增加,引起了人们采用新方法、技术和工具对其进行分析的兴趣。由于生物系统中存在的信息传递、编码与现代通信系统中的信息传输与编码的相似性,因此将现代通信工程中的纠错编码理论应用于生物遗传序列的研究和测试系统的设计并取得了一些可喜的进展。本文基于通信工程的纠错编码理论对生物系统信息分析方法进行研究,对若干对象的序列进行分析,旨在为通信纠错编码理论在生物学领域研究中的应用寻求新的途径和方法。开展工作如下:1、根据三联体密码在遗传信息表达过程中的重要作用,将三联体密码(而不是单个碱基)作为遗传信息的基本信息单元,同时考虑相邻密码子之间的相互作用,借鉴通信编码理论中分组码编码模型的设计、分析方法,通过试验选定基于分组码的(6,3)分组码模型。选定GC含量不同的12种原核生物和9种真核生物作为分析对象,利用(6,3)分组码模型对它们的DNA序列进行分析,利用码距作为特征参数与分析对象的生物特征进行对比。分析结果在表明原核与真核分析对象的平均码距在起始密码子附近和终止密码子附近均呈现出显著变化,在原核生物的SD区域也有显著变化。2、在纠错编码中,卷积码是一种具有较好性能的信道编码方式,理论和实际上均已证明卷积码的性能至少不比分组码差,应该可以寻找更好的卷积编码模型来分析DNA序列的编码特性。参考分组码模型分析方法和结果,借鉴通信编码理论中卷积码编码模型的设计、分析方法,基于密码子简并性、密码子上下文关联性、碱基短程关联占优特性,使用三联体密码作为基本信息单元,设计了(6,3,1)卷积码分析模型。利用(6,3,1)卷积码模型对所选12种原核生物和9种真核生物DNA序列进行分析,结果表明原核与真核分析对象的平均码距在起始密码子附近和终止密码子附近均呈现出显著变化,在原核生物的SD区域有显著变化。此外,所有对象的平均码距曲线在编码区表现出明显的周期3特性。根据观察到的不同GC含量的分析对象平均码距曲线分离的特性(特别是对于原核生物),我们在实验中新定义了一个参数:特征平均码距(CACD),它与GC含量具有关联,与原核生物GC含量具有较好的比例特性。这赋予了编码参数以生物特征,表明卷积码模型在生物信息研究中具有深入研究和应用的潜力。由于上述分析模型的设计是基于生物遗传信息的通用特性提出,因此对分析对象没有依赖性,可以对多类对象进行分析而不需要对模型调整。3、侧重于基于卷积码的分析模型,根据碱基短程关联占优特性,对参数进行了对比分析。考虑通常分析方法中常采用将单个碱基作为基本信息单元,选定(2,1,1)卷积码模型进行分析。考虑过渡状态的对比,选定(3,2,1)卷积码模型进行分析。通过对编码输出长度、码距计算码长等参数的对比分析,初步确定效果较好的(6,3,1)、(3,2,1)和(2,1,1)模型作为分析模型。4、将基于纠错编码的分析模型应用于序列相似性分析。使用所设计的(6,3,1)、(3,2,1)和(2,1,1)卷积码模型对11个物种(包括人,山羊,负鼠,鸡,狐猴,小鼠,大鼠,兔子,牛,大猩猩和黑猩猩)的β-球蛋白第一个外显子编码序列的相似性/不相似性进行分析。利用L/L和M/M矩阵的归一化最大特征值构建8分量矢量,计算其两两端点间的欧几里得距离,分析结果反映出3种灵长类对象(人,黑猩猩,大猩猩)之间由于进化关系而存在的强相似性,而与负鼠(距现存哺乳动物最远物种)和鸡(其中唯一非哺乳动物对象)的相似性很弱。数据分析的结果表明所提出的方法可以反映所分析的DNA序列的重要信息。

其他文献

镁合金半固态成形的现状及发展前景

镁合金以其独特的性能在许多领域得到广泛的应用，但由于镁的化学活性高，成形工艺较困难．在工程应用中受到一定的限制。从非枝晶坯料的制备、坯料的二次重熔、坯料的成形工艺三方

期刊

镁合金半固态成形坯料制备二次重熔

怎样利用多媒体培养低年级学生的数学学习兴趣

多媒体以其生动形象的画面、动听悦耳的声音，为数学课堂带来了更多活力，能够有效激发学生的学习兴趣，让学生的思维始终处于活动状态，积极主动地参与到数学教学活动中。文章主要探

期刊

低年级数学学习兴趣多媒体

基于高频渐近方法的导弹目标群动态RCS仿真

针对导弹目标群的动态RCS仿真问题，该文提出一种基于高频渐近理论的高效预估方法。该方法基于最小能量弹道仿真得到弹头、诱饵和助推级等群目标的弹道，在测量雷达坐标系下解算

期刊

雷达信号处理导弹目标群复杂场景电磁散射RCS

语文教师实用研究技法:教育叙事法

<正> 教育叙事,是适于广大教师的一种常用的简便易行的研究方法。所谓"教育叙事",指的是教育工作者用叙事、讲故事的方式表达的对教育、教学的理解与思考。教育叙事,叙的是教

期刊

叙事法教学理念教育叙事叙事研究

做强产业带富群众

罗甸县按照引产业到镇、引企业到村、引技能到户、带增收到人的“三引一带”扶贫思路，以项目实施为抓手，促进农业增效、农民增收、农村发展。

期刊

产业群众项目实施农业增效农民增收农村发展罗甸县

Z公司电力营销业务内部控制研究

电力作为一种广泛使用的清洁能源与国计民生息息相关,工业生产、商业服务、居民生活都离不开稳定的电力供应,因此电力行业是重要的基础产业和社会公用事业。随着电力改革深入推进,价格机制进一步理顺,电力市场化交易规模不断扩大,能源监管和服务水平不断提高。这一系列的变化意味着能源市场竞争加剧,电网企业利润空间减小,承担服务要求变高,受监督管理更严格。为适应瞬息万变的外部环境,保证企业经营服务稳定,促进决策规范

学位

内部控制电网企业电力营销

纳米硒复合包装材料的制备及其在果蔬保鲜中的应用

纳米硒具有毒性低和生物活性高等优点,在动物养殖、生物医药和植物营养等领域已有较为广泛的应用,但在食品包装材料方面的研究还鲜有报道。本文以不产氧光合细菌(Rhodobacter

学位

不产氧光合细菌纳米硒包装材料保鲜

国有土地使用权出让合同诉讼分类审查研究

国有建设用地使用权出让合同(以下简称土地出让合同)是国有土地使用权有偿出让制度的重要组成部分。土地出让合同纠纷的有效解决是确保国有土地有偿出让制度健康发展的最后一环,其重要性不言而喻。学界对于土地出让合同法律属性的争议使得根据合同法律属性选择诉讼程序的审判规则“失灵”,导致土地出让合同纠纷的诉讼模式处于混乱状态。面对当前土地出让合同纠纷诉讼模式不一,立法、司法态度不明朗的境况,本文立足于当前法治框

学位

混合合同分类审查合同标的请求权基础优益权作用

基于纠错编码理论的DNA序列编码特性分析

其他学术论文