基于序列编码的蛋白质分类问题研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:peibinggu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质分类问题作为蛋白质组学研究中的一个重要分支,近些年已吸引了越来越多研究者的关注。对蛋白质相关分类问题的研究是全面掌握蛋白质结构及功能的前提与基础,也在细胞生物学、分子生物学、医学和药理学中有着极其重要的角色扮演。一般情况下,蛋白质的分类问题研究均可以分为如下三个步骤:构建合理的数据集、设计有效的序列编码方案以及采取高性能的分类算法。本文围绕蛋白质分类问题预测这一主题,主要针对蛋白质序列的编码方法及分类预测算法两方面进行了深入研究,主要工作包括:1.针对蛋白质结构型分类预测问题,基于序列信息及二级结构特征提出了一种新的蛋白质序列编码方法。结合支持向量机分类算法,构建了一种全新的、比较实用的蛋白质结构型分类模型。该预测模型不需要引入任何其它信息,具有计算简单、快速的优点,针对四个标准数据集的刀切法检验都获得了较高的总体分类精度。另外,在经过对分类模型参数选择问题的讨论及一系列对比实验验证之后,结果表明,本文构建的分类预测模型具有较强的自适应、泛化和推广应用能力。2.针对蛋白质亚细胞定位分类预测问题,本文主要对蛋白质序列的编码问题及预测模型展开了研究。首先,文章提出了从不同视角对蛋白质序列进行编码的方案,其中引入了用于序列可视化的混沌游戏表示方法及新的序列统计信息的抽取方法;其次,本文选择在复空间对两部分特征向量进行并行融合,然后将该向量作为一致性距离统计分类的输入,并在两个标准数据集上验证所构建预测模型的可行性与效用性,接着将本文方法与已有工作进行比较,实验结果表明,预测模型从序列编码到分类预测等环节都采取了较为合理的处理方式,因此构建出的整个预测模型是合理且有效的。
其他文献
点集S是图G的一个全控制集,如果图G中的每个点都与点集S中的一个点相邻.设图G中不含孤立点,我们称图G的全控制集的最小基数为图G的全控制数,记作γt(G).基数为γt(G)的全控制
本文有两个主题:第一个是关于bi-Holder映射的。在这一部分,我们定义了bi-Holder映射,这种映射推广了bi-Lipschitz映射。得到了一些bi-Holder映射的性质;第二个主题是关于非齐
第二代小波变换是近几十年来,小波分析理论发展的重大突破。与第一代小波变换相比,第二代小波有着明显的优势。它不再依赖于某一给定小波函数的伸缩和平移,而是在时域内,采用提升
近年来中国横向并购活跃,然而行业巨头间的横向并购仍然充满挑战。通过对美年大健康收购慈铭体检的案例研究,本文旨在分析行业巨头横向并购的成功因素。本文主要讨论了以下三
岩石作为一种由矿物和岩屑在地质作用下按一定规律聚集而成的自然物体,不同种类岩石表现出不同的物理和力学性质,而岩体的工程稳定性主要取决于岩性、其内部的结构面以及岩体所处的应力状态环境,以往关于不同种类岩石的裂隙扩展问题并未进行系统的研究和总结。因此,进行含通透裂隙不同种类岩石的裂隙扩展研究具有重要的实践价值和理论意义。本文采用砂质泥岩、红砂岩和灰岩制作含15°、30°、45°、60°和75°倾角通透
研究目的:应用3.0T全身背景抑制弥散加权成像(whole-body diffusion-weighted imaging with background body signal suppression,wb-DWIBS)技术,探索该技术在乳腺癌骨转移患
本文主要讨论了Lorentzian空间形式中类空超曲面的高阶脐性,在一定条件下刻画了超曲面Mn的一些k-脐特征及对r-牛顿算子的应用.论文共分为三部分:第一部分,主要介绍了Lorentzia
学位
真空预压过程中真空压力随深度的增加而减小,真空吸力减小,将会导致深层软土加固效果欠佳,可能会引起不均匀的固结等工程问题。基于此,文本开展了真空预压室内试验,探究了真空预压新方法,该方法主要是通过注气的方式使得深层土层产生裂纹劈裂,加速土体的固结。许多专家学者采用室内试验、理论分析方法和数值方法,致力于研究排水板真空压力的分布、水平变形和沉降演化规律、孔隙水压力变化规律以及真空预压过程中的不排水抗剪
信息时代,信息技术的不断发展,使得传统版权逐渐向数字化方向靠拢,数字版权应运而生且发挥着日益重要的作用,但技术的进步也使得侵权盗版资源的复制与传播变得更加简单快捷,数字版权保护陷入困境。与此同时,区块链技术基于其独特的技术优势为数字版权保护带来了难得的机遇。基于区块链技术的数字版权保护是我国数字版权发展的内在需求,传统数字版权管理模式下,版权登记成本高、耗时长、过程也稍显繁琐,数字版权保护力度跟不