用网络的方式识别生物基因序列motif

来源 :苏州大学 | 被引量 : 0次 | 上传用户:w633744
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因在转录的过程中,往往受到位于基因上游的一些DNA序列片段的控制。这些片段通常很短,并且表现出很明显的保守性,我们称其为motif,,如何识别生物基因序列motif是现代生物信息学研究的重要课题之一。 识别motif的方法很多,其中Gibbs抽样算法和EM算法是较为成熟和有效的方法。然而这些传统方法却存在着一些局限:如计算量大,导致处理基因序列时只能识别有限数目的motifi某些统计模型往往只适用于特定条件下的motif,缺乏一般性。2006年Jiang等借助EM算法和随机网络的结合的混合随机网络算法和同年Frankin等提出把随机网络和调整了的参数流算法结合的MotifCut算法。这些算法克服以往传统算法的局限性,并且取得了较好的识别效果。 本文着重研究了MotifCut算法的理论基础,对算法中网络结点问的边的权重的确定进行了改进,并结合识别包含CRP结合位点的DNA序列的基因数据给出了对比研究,结果表明我们的改进措施有效地提高了识别率。
其他文献
本文致力于研究带利率的经典风险模型的绝对破产,绝对破产模型是在经典风险模型的基础上,假设当保险公司无力偿还索赔时,公司可以向银行贷款来弥补暂时的赤字,继续经营业务,
期刊
一、“矫枉过正”:动有余,静不足rn传统的思想品德课往往是:教师灌输式地教学,学生被动地听、记录,课堂枯燥乏味,呆板无趣,自从新课程提出要赋予学生更多自主活动、实践活动
初中物理作为一门基础性实验学科,蕴藏大量德育的内容,在物理教学过程中,教师应精心研究教材,通过发掘、引导,把德育教育与知识传授、能力培养结合起来,使他们正确运用辩证唯
本文考虑p—Laplacian边值问题{-(|u|p-2u)=λf(u),t∈(0,1),u(0)=0,u(1)+αlim(t→1-0)u(t)=0,(1.1)正解的存在性与不存在性,其中p>1,α≥0,且λ>0是一个正参数。本文的主要内容
Banach不动点定理是不动点理论中最重要、最基本的理论工具之一.很多学者通过各种途径不断地推广和改进了 Banach不动点定理,大大推广和改进了Banach不动点理论.之后,很多学
本文讨论了分数阶复值神经网络模型的稳定性、收敛性、有界性、指数镇定、同步控制等问题.针对两种复值神经网络,利用Lyapunov函数方法和分数阶不等式技巧,以代数不等式和矩阵
非线性泛函分析是数学中的一个重要分支,因其能很好的解释自然界中各种各样的自然现象受到了国内外数学界和自然科学界的重视.非线性边值问题源于应用数学,物理学,控制论等各种应
脉冲现象作为一种瞬时突变现象,在现代科技各领域的实际问题中是普遍存在的.近年最新科技成果表明,这类系统在航天技术、信息科学、控制系统、通讯、生命科学、医学、经济领域均
本文利用核正规系法和核迹法刻画V-正则半群和V-纯正半群上的同余,并利用核正规系法研究E-反演半群上的毕竟正则同余.全文共分四章. 第一章是引言. 第二章研究V-正则半群上