人类基因启动子序列组织特异性模式发现

来源 :天津大学 | 被引量 : 0次 | 上传用户:tank12134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
辨识和分析组织特异性基因及其调控关系对理解生物体的内在活动机制、具有针对性的疾病诊断和药物设计具有重要的作用。然而现今利用现代计算技术挖掘基因表达的组织特异性及其调控网络的内在调控机制,仍然是生物信息学中最具有挑战性的任务之一。基因启动子区域的序列特征与细胞维持其基本功能及组织特异性功能密切相关,它成为研究组织特异性的一个重要线索。   本文设计和开发了发现SSR(Simple Sequence Repeats)模式和统计显著性模式方法,用于研究人类基因启动子区域序列模式与基因组织特异性表达关系。   SSR(Simple Sequence Repeat:简单序列重复)是指在DNA序列中串联重复的核苷酸序列。本文在给出SSR的形式化定义的基础上,利用启发式算法在启动子区域对SSR模式进行扫描,找出与人类组织特异性密切相关的SSR模式,并对发现的SSR模式的位置频率进行了分析和统计。通过对人类82个组织4552个组织特异性基因及924个HK基因的启动子(-1000bp~+499bp)区域进行SSR分析,实验结果共得到与82个人类组织特异性相关的SSR模式,并以肾脏和睾丸组织为例展示了部分实验结果。   统计显著性模式指在基因的非编码区域中高频出现的具有统计显著性的一段碱基序列,本文设计和开发了一种集成的模式发现算法,该算法主要包括三个主要阶段:模式搜索、模式融合及模式显著性检验。模式发现阶段融合了现有的三个模式发现算法:MEME,AlignACE及Gibbs Sampling;模式融合阶段提出了基于碱基分布的模式融合方法,此方法能有效去除阶段一中产生的大量冗余模式;最后,模式显著性验证阶段利用贝叶斯假设检验的方法验证了模式的统计显著性。实验将统计显著性模式发现方法作用于上述同样的输入数据,结果共得到来自于人类组织特异性基因的1618个模式,和来自HK基因的2个模式,这些模式中部分是现存在的模式,而另一些模式的功能还需要被验证。   通过对不同启动子区域两种模式出现的频率进行统计和分析,本文发现SSR模式在HK基因核心启动子序列区域的密度明显大于HK基因启动子序列的其他区域,而统计显著性模式则在近启动子区域出现的频率最大。基于此我们推断两种模式在调控位置和调控方式上有很大区别。SSR模式和统计显著性模式与基因的组织特异性关系的研究,为从基因的启动子序列结构特征方面了解人类组织特异性的内在调控机制提供支持。  
其他文献
随着Internet的迅速发展和快速普及,Web站点已经成为制造、发布、处理和加工信息的主要平台,但在为人们提供大量信息服务的同时,其自身结构也变得日趋复杂,Web上的数据量也飞
随着工业自动化的飞速发展,生产与生活对计算机信息的依赖程度越来越高,二十一世纪的全球已全面步入数字信息化的时代,而如何安全、可靠、高效的对海量数据进行采集,处理,存储,归档
二维卡通动画因为具有其独特的魅力而被广泛应用于娱乐、广告、教育等领域。如何有效地对已有的卡通动画进行重用,是当前倍受关注的研究课题。卡通运动捕捉是卡通动画重用的
随着现代大型医疗成像设备的飞速发展,新的成像方法和图像处理方法不断涌现,医学图像正成为临床医学研究、诊断和治疗的依据。发展医学图像质量评价方法对于监控和调整医学图
Hulft系统由日本世存(Sassion)公司开发的一套软件系统,这个系统可以在不同操作系统平台下异构数据的网络环境中完成文件共享和数据传输的功能,达到存储虚拟化的效果,即操作
随着经济的迅速发展与人类生活水平的提高,废旧产品的数量也不断的增加,为了减少不可再生资源的浪费,闭环供应链已经成为众多学者关注的话题。与传统供应链相比,逆向供应链增加了许多不确定因素,例如回收数量的不确定性,回收质量的不确定性等等,这样会给供应链的管理带来很多难题,但是闭环供应链的实施在某种程度上会给企业带来好处:首先闭环供应链的实施可以减少制造商的生产成本,增加其利润,所以越来越多的制造商都主动
模糊推理是模糊系统和模糊控制的核心内容,受到广泛的关注。在模糊推理系统中,模糊隶属函数的确定和模糊推理规则的建立一直是难点问题,也是模糊推理系统的关键部分。B样条函
随着Web上的信息猛速增长,基于关键词全文匹配的传统搜索引擎,已不能满足用户在查全率、查准率方面的需求。同时随着科技的发展,人们对于智能化、专业化的需求也一直在提高,
科技项目管理是一项复杂的系统工程,有效管理科技项目是推动科技事业不断向前发展的重要因素。信息技术参与科技项目管理以来,发挥了巨大的作用,得到了各级科技管理部门的重
文档图像的版面分析是文档信息处理系统的重要组成部分,以及复杂文档OCR必不可少的环节,它是实现纸质文档数字化的重要环节。版面分析技术广泛应用于文档自动检索、办公自动