【摘 要】
:
基因转录调控是整个基因表达调控体系的一个重要方面,是基因遗传信息传递和表达的枢纽,也是基因表达调控机制发挥作用的重要环节。识别转录因子结合位点是理解基因转录调控机
论文部分内容阅读
基因转录调控是整个基因表达调控体系的一个重要方面,是基因遗传信息传递和表达的枢纽,也是基因表达调控机制发挥作用的重要环节。识别转录因子结合位点是理解基因转录调控机制和基因表达模式的基础。依靠传统的实验方法不仅耗时耗力,而且花费巨大。随着技术的进步,用计算方法识别原核和真核生物中的编码序列有了很大的发展。当前也有一些预测结合位点的算法,但这些算法大都不是全基因组范围的算法。基于缺乏高效精确地算法来计算预测整个基因组范围的结合位点和顺式调控模体,如果能设计出一套更加高效的全基因组范围的计算预测工具,这将是信息生物学界非常有意义的一件工作。本文首先介绍了生物信息学产生的背景,经历的阶段,以及其发展历程。对生物学的基本知识进行了简单的介绍。了解了转录因子结合位点的基本概念。对我们要研究的酵母菌进行了分析。最后介绍了一种真菌酵母菌的全基因组范围的结合位点从新预测算法,算法大致可以分为四个部分,首先是准备数据阶段,其次是多模体发现工具组合使用阶段,然后是模体间相似度比较阶段,最后是对海量数据进行反复多重聚类阶段。之后我们对酵母菌的结合位点的预测应用了该算法,首先从SGD (S. cerevisiae Genome Database)中得到日标基因组和比较相近的基因组集合,其中我们使用了MEGA工具生成了真菌进化树,帮助我们选择了适合的比较基因组,然后使用perl程序进行基因上游截取,本文我们截取1000pb的长度,使用MEME, BioProspecter, Weeder, MotifClick四种模体发现工具,分别发现模体,本文以8pb长度作为输出模体长度,然后对找到的各个模体使用SPIC算法进行相似性比较,最后通过反复聚类得到理想的结果。
其他文献
随着现代工业生产的迅速发展,人们的物质生活所需品日益丰富,生活质量极大地提高。与此同时,由于工业生产设备的大量投入使用,对灾难性事故危害的潜在风险的控制也成为了不容忽视的问题,人们对危害其生命、财产和环境等各类风险也越来越难于容忍。为了提高工业生产的安全性,通常采用安全仪表系统(Safety Instrumented System, SIS)在出现安全事故之前发挥其安全功能,避免安全事故的发生,或
当前,在互联网上传输的视频数据占据了网络流量的大约70%。毫不夸张的说,视频数据是大数据时代最大的数据。如何让计算机更好的看清与理解眼前的世界不是一个简单的问题,近年来也
基于监控场景下的行人重识别问题是当前计算机视觉领域研究的热点,主要任务是指行人在穿梭于监控场景中摄像机网络的视频或图片的匹配,特别是对于非重叠视域的多摄像机网络结构
随着信息技术的高速发展,传统医疗正在向更加电子化和数字化的方向发展。电子医疗档案是标准化的居民基本健康相关信息。它不但能为医疗工作者提供参考信息,还能和其他信息系
近几年,随着国内互联网技术的迅猛发展,几大电商如淘宝、京东等,正悄然改变着大众的生活方式;同时,随着微博等社交网站的崛起,国内互联网用户越来越多的在网络上发布自己的主观观点
计算机技术的快速发展使得有限元分析在机械设计与研宄中得到了广泛的应用。在机床设计与制造领域,运用计算机动力学仿真与CAE技术可以在机床开发试制之前对其零部件的工作情
云计算给社会带来了许多变化,社会生活被不断地数字化。如何处理海量的数据成为了一个令人关注的话题。Hadoop是一个分布式计算软件框架,其包含分布式存储和MapReduce计算,能
强化学习是一类无需先验知识的机器学习方法,以Agent与环境不断的交互为主要特征,以寻找能带来最大期望累积折扣奖赏的策略为目标。强化学习中环境可能具有大状态空间甚至连续
高维多目标优化问题是现实社会中普遍存在的一种实际优化问题。相对于普通两到三个目标的多目标优化问题,高维多目标优化问题的最明显特征是目标个数较多,一般大于三个。而且,随
学术影响力评估是指针对文献、学者、期刊和科研机构等评估对象,评估其在学术领域的影响。学术影响力评估可以分类为以下四类问题:(1)文献价值评估问题及预测问题;(2)作者影响