【摘 要】
:
随着人类基因组计划(Human Genome Project, HGP)的完成以及模式生物基因组计划的蓬勃发展,产生了越来越多的分子序列数据。对这些序列数据进行科学的分析、处理、研究不仅推
论文部分内容阅读
随着人类基因组计划(Human Genome Project, HGP)的完成以及模式生物基因组计划的蓬勃发展,产生了越来越多的分子序列数据。对这些序列数据进行科学的分析、处理、研究不仅推动了生物信息学研究方法和技术的发展,而且在人类疾病及重大疫情的预防、诊断、治疗、新药开发等领域也有着广阔的应用背景。如何给出有效的基因序列图形表达方式并在此基础上对基因进行相似性分析及进化关系分析已成为生物信息学中一个热门的课题。本文着重研究基因序列的图形表达,基于图形表达的基因序列的相似性分析以及采用聚类技术分析基因序列的进化关系。本文的主要工作有:(1)提出一种新的DNA序列的图形表示——JZ曲线组。在Z曲线的基础上结合廖波3D图形表达方法给出了一种新的图形曲线——JZ曲线组,证明了JZ曲线组中没有回路,同时JZ曲线组包含部分的生物特性。(2)构造了DNA序列间相似性度量的特征矩阵——J/J矩阵。结合JZ曲线组的J/J矩阵不仅描述了序列碱基的化学性质,而且提取了基因序列的生物意义。并通过对11种生物的β球蛋白基因的第一外显子的编码序列进行相似性分析,实验结果表明,在JZ曲线组的基础上结合J/J矩阵可以简单有效的分析DNA序列的相似性。(3)基于JZ曲线组,提出一种基于谱图理论的模糊聚类的传递算法构造进化树。对序列的进行聚类,以聚类结果指导构建进化树,确定序列间的进化关系。同时,聚类算法不仅考虑了类与类之间的分散程度,而且考虑了同一类的紧凑程度,提高了结果的准确性。通过对11种生物的β球蛋白基因的第一外显子的编码序列以及H1N1病毒的NA基因序列构建进化树,实验结果表明该算法的有效性。
其他文献
多水下机器人协调机制是水下机器人研究的重要组成部分,编队控制是多水下机器人协调中的一个典型问题,具有重要的研究意义和实用价值。针对水声通信的相关特点,本文以多AUV编
随着网络的发展,它使得网络资源变得丰富的同时也为互联网自身的安全带来了隐患。网络入侵行为隐秘性强,不受时间与地域上的限制,所以其经常发生在正常网络的行为活动中。主
随着关键字检索在Web搜索领域取得巨大成功,XML数据上的关键字检索技术也得到了广泛的关注。为了提高检索结果的有效性和性能,检索系统需要综合考虑以下问题:理解查询语义、
近几年,为了满足一些特殊油气资源开发的需要,各种新技术相继被提出,井下闭环钻井技术也被人们所重视。井下闭环旋转导向智能钻井系统的研制成功将最终实现可控闭环三维轨迹
随着Web的不断发展,隐藏于Deep Web中大量有价值的数据依靠传统的技术已经不容易访问,因此如何高效地访问Deep Web成为了一个亟待解决的问题。作为下一代Web发展方向的语义Web
订货系统是零售行业服务管理的一个重要组成部分,以往各个零售店都是通过人工填写单据,或者通过电话传真的方式订货,造成了人工成本的浪费并影响了订货反应的实时性。本文针
在SOA中,BPEL被广泛用来定义和执行业务流程组合。执行业务流程时,由于SOA本身具有松耦合、分布式等特点,因此在调用Web服务时可能会因为网络、服务失败或者提供服务的主机不
随着网络技术的发展和数字图像设备的普及,大容量图像数据库在各行各业有着广泛的应用,如何快速、有效地查找到图像库中相关的图像是一项具有挑战性的工作。于是,基于内容的
随着互联网即时通讯技术的发展和普及,手机短信、即时信息、基于互联网和手机短信的客户评论、新闻评论等短文本形式的信息大量出现,短文本信息处理领域的重要应用所迫切需求,使
本文主要研究了垂直搜索引擎实现的关键技术,从细节上对两个核心模块,即主题爬虫技术和索引技术进行了深入地研究分析。在主题爬虫的设计中,通过结合基于内容和链接分析的主