基于柔性神经树及其集成的蛋白质三级结构预测

来源 :济南大学 | 被引量 : 3次 | 上传用户:ytxiaokang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着结构基因组的出现,通过结构进行生物功能预测已经发展成为结构生物学和生物信息学的主要目的之一。蛋白质的功能大体由它的三级结构决定的。研究蛋白质的结构有非常重要的意义,可以有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,了解蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用。因此了解蛋白质的三级结构是了解其功能的前提。本文系统的介绍了蛋白质三级结构、蛋白质表示方法、柔性神经树以及集成学习的基本理论,在总结前人研究的基础上,提出了使用柔性神经树及其集成预测蛋白质三级结构,其中采用多表达式编程算法对柔性神经树树结构进行优化,模型中各个参数采用粒子群优化算法进行优化。集成学习采用了纠错输出编码,并且详细的对纠错输出编码的基本原理和结果决策方法进行了阐述,将多分类问题巧妙的转化成两分类问题,从而达到较好的预测结果。本文使用柔性神经树预测蛋白质三级结构主要分为三个阶段:蛋白质特征提取、建立预测模型和集成学习。(1)蛋白质特征提取。为了方便计算机更好的处理数据,首先要对蛋白质进行特征提取,即将蛋白质的氨基酸残基序列转化为输入空间向量的过程,也称为编码过程。特征的选取对于预测结果非常重要,目前常用的表示蛋白质特征的方法有主要有氨基酸组成模型(AA)、多肽组成模型、伪氨基酸组成(PseAA)、疏水模式等。本文重点运用伪氨基酸组成作为输入特征,并结合其它特征进行特征融合。实验表明使用伪氨基酸组成和其他特征的融合取得了较好的预测精度。(2)建立预测模型。柔性神经树克服了其它非线性模型存在的速度慢、网络结构不易调整等缺陷,具有以下优点:不需要事先设计网络的输入、输出和网络结构,柔性神经树模型可以自动的设计和优化网络结构和参数;各层之间的连接不必是完全的,允许跨层之间的连接;柔性神经树的进化结果通常要比一般神经网络结构简单、泛化推广效果好;本文选用柔性神经树作为预测模型,其中采用多表达式编程算法对柔性神经树结构进行优化,模型中各个参数采用粒子群优化算法进行优化。(3)为了进一步提高分类器的性能,最后将分类器进行集成学习。通过使用数据集C204和640进行结果验证表明集成学习对最后的预测精度有很大的提高。
其他文献
XML查询处理技术,目前普遍采用的是路径分解和一次一集合的匹配方式,这种处理方式在效率上明显优于传统的导航式遍历方式。在这种处理方式中,节点编码和结构连接是非常重要的
随着信息化建设的不断发展,越来越多的企业使用信息化技术来管理公司业务,但多数企业内部业务部门繁杂,信息系统之间软件开发部署存在异同。随着各部门信息交互需求日益增加,
随着无线通讯技术的快速发展以及智能手机的广泛使用,手机与互联网的结合已经使手机广告成为了重要的大众传播媒体。由于目前的手机广告形式在广告展示方式、展示效果、精准
随着数据的大量积累和市场竞争的日趋激烈,人们对知识和信息的需求越来越迫切。数据挖掘技术可以发现隐藏在数据中的信息,进而找到尚未发现的知识。这些隐藏在数据中的信息是
分布式视频编码是一种新兴的视频编码方案,编码端使用帧内编码降低编码复杂度,解码端使用帧间译码发掘编码帧和关键帧之间的冗余信息。编码方式将编码复杂度从编码端转移到解
在工业4.0的大背景下,我国的工业也进入了“中国制造2025”时期,2015年我国工业持续发展,而不管是在轻工业还是重工业中,多关节机器人的作用都对推动工业的发展有着非常重要
随着计算机网络被应用到社会的各个领域,人们对其的依赖程度不断地提高。攻击者的知识不断增加和多样自动化工具的日趋成熟使网络安全问题日益突出。传统的安全技术(身份认证
随着信息技术的飞速发展,个人与组织对信息存储的需求越来越大,存储区域网也因此得到广泛的使用。然而存储区域网中的光纤通道存储区域网络与以太网存储区域网络各有优缺点,
粗糙集理论是波兰学者Pawlak教授提出的一种用于数据表达和分析的有效的数学工具。经典的粗糙集理论以不可分辨关系(等价关系)为基础,其研究对象是完备信息系统,即所处理的信息系
图像获取过程中物体的相对运动或者对焦不准会造成图像的局部模糊,随着数码相机的普及,模糊图像复原成为计算机视觉研究热点之一。本文主要对单幅模糊图像的几种编辑方式进行