基于多尺度熵的DNA序列相似性分析

来源 :深圳大学 | 被引量 : 1次 | 上传用户:ode
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划的完成,分子生物学技术迅猛发展,庞大数量的基因序列数据被获得,人们的研究重点逐渐向着数据分析转变。在这个波澜壮阔的后基因时代中,生物信息学的出现标志着人们提出了一门研究生物学数据的新型交叉学科,它是以计算机和网络为处理工具,运用数学、统计学、物理学和信息学等相关理论和方法来深入研究核酸和蛋白质等生物大分子。我们迫切需要处理的任务就是分析和理解生物序列数据所要表达的生物意义和深刻内涵。目前科学家们将研究重点放置于研究DNA和蛋白质等生物大分子以及它们之间的关联性等方面的问题。生物信息学已经走在了生命科学和自然科学深入研究的前沿。DNA序列相似性分析是生物信息学中基础而又具有重要意义的研究课题,它在研究生物序列的结构与功能、生物进化关系和物种分类等方面都扮演着至关重要的角色。本文基于多尺度熵对DNA序列的相似性进行分析,主要研究的内容和创新点如下:1)通过图形和数值两种表示方法,对七种病毒DNA序列进行了转换,然后计算每个序列的样本熵以及各个序列之间的互样本熵。通过实验数据说明了利用样本熵和互样本熵的方法对DNA序列相似性进行分析是切实可行的,而且选择合适的序列表示方法是非常重要的。2)通过滑动窗口的方法对DNA序列的局部相似性进行了动态仿真,使用不同的窗口大小并对该窗口内的序列求其样本熵,然后对得到的图形进行观察,找到了在不同表示方法下的“最匹配”窗口大小。利用“最匹配”的窗口进行动态仿真,得到的图形既能够清晰地观察序列之间的相似程度,又能够判断序列之间差异发生的大致位置。3)在多个时间尺度下对DNA序列的样本熵进行仿真计算,证明了多尺度熵比样本熵在序列相似性分析中具有更好的效果,最后还与DTW算法进行比较,加强了实验结果的说服力,证明了使用多尺度熵对DNA序列相似性分析方法切实可行。
其他文献
铁路技术规章体系建设是铁路技术管理工作的重要内容。基于系统工程、业务流程重组和标准化等理论,分析铁路技术规章体系现状与面临的形势,提出铁路技术规章体系构建的总体目标
本文研究了益生菌干预对高脂血症大鼠粪便短链脂肪酸含量的作用规律。复制高脂血症大鼠模型,利用实验室保藏的具有较好降胆固醇效应的Lactobacillus plantarum 67、Lactobaci
<正>我国企业登记制度与西方很多国家有所不同,在西方,很多国家的企业登记工作由法院来进行,如,在法国,由各城市的商事法庭负责企业登记注册工作,德国、韩国由各地法院负责企
会议
目的:评价应力刺激联合当归补血汤治疗下肢骨干粉碎性骨折的临床疗效。方法:选择120例符合下肢骨干粉碎性骨折并均行内固定手术治疗的患者,随机分为3组:叩击组(骨应力刺激仪)
【正】 众所周知,福建是我国华侨人数最多的省份之一。据1955年的统计,福建的海外华侨人数为3 676 693人,占全国华侨总数的30.4%。但由于完整统计资料的匮乏,关于近代福建华侨
根据成都市1991~2010年逐日降雨数据,分析降雨量和降雨侵蚀力的分布特征。结果表明:成都市多年平均降雨量先增大再减小,8月份降雨量为245.79 mm,占全年降雨量的27.76%。7,8月
贯彻党的十七大和胡锦涛总书记等中央领导对检察工作的重要指示精神,近年来,上海市各级检察机关紧紧围绕“强化法律监督,维护公平正义”的检察工作主题,通过履行法律监督职能
语言不仅可以表达抽象的意义,而且可以描绘具体的形象.语言形象的生成与实现本质上是一个语义化形象信息的交流、传播和转换过程,是在一般语言功能框架下实现的具有特殊意义
文章应用实证研究方法,对消费者参与电子信息技术制造企业产品创新的激励因素进行分析,结果发现,消费者精神和情感需求的满足对其参与制造企业产品创新的激励作用最大,它不仅激励
该文研究了不同集流措施对黄土高原坡面生长的林木组织水势、光合色素含量及净光合速率以及对刺槐幼树高、径和树冠生长的影响。结果表明,拍光林地坡面及在拍光坡面喷涂有机硅