基于HMM模型的顺式调控模块识别方法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lyyzk09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
转录因子结合位点是调控区域的特定的DNA片段,又被称作模体,是重要的基因调控元件。在真核生物中,多个转录因子结合位点组成顺式调控模块(CRM),对临近的基因的表达提供着更为复杂的调控功能。人们逐渐的从对单个转录因子结合位点的研究转向对顺式调控模块的研究。如今,用计算方法识别顺式调控模块是生物信息学的一个热点问题。针对HMM模型在顺式调控模块识别中的应用问题,本论文的主要工作如下:研究了当今HMM模型在CRM模块识别方法中的应用情况,发现现有模型没有很好的描述模块内的模体相关性。本文提出了一种新的HMM模型用于描述这种相关性。在这个模型的基础上,提出部分参数设定的规则以降低模型的复杂性,提出一种基于Viterbi算法的参数学习过程。进一步用Baum-Welch算法和这个新的学习算法训练部分参数,用Viterbi算法识别模体。根据合成序列进行了实验分析,证实本模型可以很好的应用于调控区域相关模体的识别和分析上。提出一种CRM模块识别的方法TSHAS,该方法是一个基于HMM模型与序列统计的两阶段的方法。在HMM模型部分,先用假设检验在序列中选出满足条件的所有模体实例,在这些模体实例上构建了相邻模体相关的HMM模型,用来去除模体实例的重叠现象;采用了改进的Viterbi算法来解码序列,并用基于Viterbi算法的学习过程调优模型参数。在序列统计部分,模拟了HMM模型输出的序列得分在随机情形下的分布的情况,进一步,根据窗口得分的P-值计算,把序列上得分显著的窗口作为最终结果输出。用基准测试库与现行的几个方法进行了比较,证实了TSHAS方法有一定的优越性。
其他文献
二元经济通常是指在社会经济系统中,存在着以农业为代表的传统经济部门和以工业为代表的现代经济部门,二者在生产规模、技术水平、投入要素、组织方式、增长特征和工资率等方
大数据时代,个人数据的商业利用价值越来越高,数据控制者和处理者正在处理越来越多的个人数据,侵犯个人数据的事件已屡见不鲜。互联网的虚拟性使得个人数据保护存在较大难度,各国个人数据保护法越来越倾向于扩大管辖权范围。欧盟率先一步,在《95指令》的基础上于《一般数据保护条例》中大大拓宽其域外管辖范围,在其地域之外对全球产生影响。本文旨在探究欧盟个人数据保护法——《95指令》和《条例》,尤其是已取代指令的《
随着经济社会的发展,以及全民环保意识和维权意识的提高,对环境与健康问题处理的好坏逐渐为评判环境保护工作成败的核心指标,各级环保部门要以主动应对的姿态来加强环境与健
为了研究一般大气环境下酸雨作用对砌体结构抗震性能的影响,以4榀相同特性的砖墙作为研究对象,进行了酸雨模拟加速腐蚀试验和低周反复荷载试验,考察了砖墙的抗震性能随着酸雨腐
2010年12月17日在北京师范大学英东学术会堂隆重召开了由北京师范大学发展心理研究所、北京金色摇篮潜能教育机构共同主办的“潜能发展心理学与潜能教育”专题研讨会。本次研
城市规划主要是对限定时期内城市经济和社会发展进行整合以及综合部署,属于宏观角度,研究范围主要是整个城市和城市内部区域。但是建筑设计是相对微观的,主要研究对象是城市
总体上,创业失败研究还处于起步阶段,目前研究的重点在于失败后的行为,如失败学习、后续创业意向和表现等,但缺乏对创业失败到后续创业间的过程的系统分析和实证检验。同时,
刚接替教务工作时,我是一名连班主任都没有当过的教师,那时的我,总觉得教务工作好歹是一个官,也就用不着像上课那么累了吧,还在暗自高兴的时候,就被校长谈话了,说我该排课了,
深情融冰雪调解泯仇怨──安徽油泵油咀厂抓民事调解工作二三例张晓黎,叶明柱省级先进企业安徽油泵油咀厂座落在旗鼓山麓、古代谋臣范增的故乡——巢湖市亚父乡,厂区内常住人口
在正常的学校生活中难免会遭遇如自然灾害、外来人员的伤害、校内暴力冲突等意外伤害事故等等校园危机事件。笔者所在的嘉兴市建筑工业学校借助生涯彩虹社会工作室,介入校园