基于序列信息的DNA位点信息的预测研究

来源 :景德镇陶瓷学院 | 被引量 : 0次 | 上传用户:lihai_feng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的实施,海量的DNA序列被测序出来,但是对于DNA序列的性质、修饰属性以及功能的认识是非常有限滞后的。因此探索出基于系统、人工智能模式识别以及信息处理等方法对DNA序列的性质、修饰属性以及功能进行预测的模型是至关重要的。本文研究目的是基于DNA序列分析出隐藏在其序列中的遗传信息如:DNA剪切位点、DNA甲基化位点和核小体的预测等,从而为疾病诊断和治疗提供有效方法,为药物研发设计提供辅助。医学界对研究DNA甲基化过程非常关注,它不但和人类老化、肿瘤有关,还和一种单亲遗传病有一定的联系。本文利用核苷酸密码子3→1的序列编码信息表达DNA序列的全局性的顺序信息,基于氨基酸的物理化学属性,建立了DNA离散化模型描述方法,运用NCR和SMOTE算法优化所建立的非平衡数据,采用SVM建立了预测器,Target-Jackknife交叉验证测试方法证明我们建立的DNA甲基化位点预测器的预测成功率比现有预测器都有较大的提高。核小体在很多生理机能的过程中扮演着至关重要的作用,例如,DNA的损伤自我修复、复合、重复、基因表达、染色体的构成,mRNA的拼接等。本文基于核苷酸序列编码提取DNA序列特征,提出了一种基于特征融合的DNA序列特征表示方法。采用支持向量机(SVM)算法对DNA序列核小体位置信息进行预测,预测结果显示有较好的预测识别效果。内含子和外显子的交汇部分被称为剪切位点,本文基于核苷酸二联体结构属性以及成份提取DNA序列特征,采用前向特征选择方法对提取的特征进行优化,利用模糊k-近邻算法(Fknn)建立了DNA序列剪切位点预测器,交叉验证表明预测成功率比现有预测器都高。
其他文献
陈田鹤先生是20世纪上半叶具有影响力的作曲家之一,他作为黄自先生四大弟子之一,深受黄自先生的影响。一生创作了大量内容丰富、形式多样的优秀作品,其作品传唱度高、影响力强,可谓二十世纪音乐创作人中的中流砥柱。他的作品影响了一代又一代的音乐人,清唱剧《河梁话别》作为陈田鹤先生创作的为数不多的清唱剧之一,对于中国清唱剧的发展起到了不可磨灭的作用。本文以清唱剧《河梁话别》为研究对象,通过分析作品了解陈田鹤的
现代分子生物学与细胞生物学的一个核心问题是揭示基因的表达与调控机制.对基因调控网络的探究有助于我们更清晰地了解细胞生物化学反应过程,同时对诸如生物制药和临床医学实
为了获得能够感应压力胁迫条件,开启相容性溶质(如本研究中用到的四氢嘧啶和海藻糖)的合成,从而提高对压力胁迫的耐受性的E.coli底盘细胞,本研究收集了七种不同的启动子(pCP6
深海链霉菌Streptomyces somaliensis SCSIO ZH66分离自我国南海深度为3536米的海底沉积物之中。深海链霉菌的所处环境十分特殊(如:高盐、高压、低温、低光照、低氧和寡营养),
强对流天气由于具有突发性和强破坏力,一直是气象预报业务中的难点和重点内容之一,展开此类天气预警预报能力提高的研究对人们的生产生活具有重要意义。闪电资料作为对流活动
红尾沙蜥(Phrynocephalus erythrurus)分布于西藏北部的羌塘高原地区,被认为是世界上垂直分布最高的蜥蜴(海拔:4500–5300 m)。爬行动物通过代谢调整来适应光、温度、食物利
近几十年来,捕食者-食饵模型产生的动力系统长期以来是理论和实验生态学家和数学科学家的研究热点,已有大量的文献都讨论了捕食者-食饵系统的动力学性质.正如文献[29]所述,不
随着汽车“轻量化”概念的提出,采用轻质材料已成为降低整车重量、减少能源消耗、实现车身轻量化的主要途径。所有金属材料中,铝合金材料减重最明显,最高可减轻汽车重量的60%
中国东海(East China Sea, ECS)是西太平洋的一个边缘海,位于我国大陆东侧,大致范围在2133°N、117-131°E之间。东海拥有丰富的海洋生物资源,而且还是中国油气资源储备的战
材料阻尼是阻尼的一种主要形式,同时也是材料的基本属性之一,它的准确测量有很重要的研究和应用价值。在材料阻尼测试中,由于实验环境的改变、以及被测对象本身的阻尼特性受