基于压缩感知的蛋白质功能分类预测

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:wanglinux_0208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着现代生物科学和计算机技术的快速发展,蛋白质序列数据增长迅猛。根据序列预测蛋白质的功能,是生物信息学的研究热点。压缩感知算法自提出得到快速发展,已经成功应用于图像处理、模式识别等众多领域,取得了很好的分类效果。本文针对蛋白质数据具有样本小、维度高的稀疏特性,基于压缩感知算法实现对蛋白质功能的分类预测。应用压缩感知算法建立分类模型能够避免复杂的特征提取过程。本文采取不同的分类方法将数据样本分为训练集和测试集,根据训练集样本构造冗余字典,随机分布高斯矩阵构造观测矩阵,然后利用l2范数最优化重建信号,最后根据测试样本的稀疏表示判别样本所属类别,实现蛋白质的分类预测,主要内容如下:1、建立了凋亡蛋白亚细胞位点预测模型。基于压缩感知算法,将蛋白质序列的结构及物理化学性质输入分类器,实现凋亡蛋白亚细胞位点的分类预测。选取在2个常用凋亡蛋白数据集ZD98和ZW225进行Jackknife测试,预测准确率分别为90.6%和87.3%。实验结果表明压缩感知算法对凋亡蛋白的亚细胞定位研究效果良好。2、建立了蛋白质质谱数据分类预测模型。该方法选取卵巢癌公共数据集Ovarian04-03-02用于预测分类,对数据集进行5-折交叉验证,总体预测准确率达到99.38%。实验结果表明,压缩感知算法应用在蛋白质质谱数据的分类有良好的分类性能和鲁棒性,具有临床应用价值。
其他文献
火电厂热工过程的自动控制是一个成熟而常新的研究邻域,一方面,基于常规PID控制的电厂DCS控制系统具有一套成熟、规范的体系,几十年的运行证明其控制策略是可行的;另一方面,电
生物体的组织结构会对其中的水分子弥散运动造成影响,反过来水分子的弥散运动反映了所处位置的组织特性。弥散张量磁共振成像(DT-MRI)在磁共振成像的基础上利用多于六个的非
社会化媒体快速发展使得网络口碑表现出更快更广的传播特性,因此成为消费者消费决策的重要参考信息,负面网络口碑因其自身具有的较强破坏力再加之网络特性愈发产生指数级传播
随着大容量、高参数机组的投入运行和新技术在火电机组中的应用,电站系统日趋复杂,人们对机组的安全性和经济性越来越重视,火电机组仿真技术在对运行人员的培训,火电机组调试、运行和改造过程中发挥着巨大的作用,因此,经济高效的火电机组仿真培训系统越来越受到重视,对仿真机的要求也越来越高。本文基于工程模块化建模、流体网络、集总参数的方法,建立并调试了某电厂一机多模仿真机系统,同时结合仿真数学模型,对部分仿真算
目的:以HepG2.2.15细胞株为研究模型,茜草科植物黄根(Prismatomeris connata)根部具有抗乙型肝炎活性为基础,对其进行分离纯化,探讨黄根的化学成分抗乙型肝炎病毒的作用机制。
由于温室效应导致地球环境不断恶化,为了解决气候问题,欧盟发布了《移动空调指令》和《含氟气体法》,其规定在2011年以后禁止在制冷系统中使用GWP值超过150的制冷剂。而在2017年后,则限制在汽车空调系统使用高GWP值的制冷剂。由于目前常用的第三代制冷剂的GWP值都远高于规定标准,并且常用的HFC-134a的GWP值为1400,远高于法令所规定的标准值。HFO-1234yf(2,3,3,3-四氟丙
学位
<正>自幼学书,临近不惑,了无所成,惶愧多多。然近年来于书学一道,颇有进益,故作此自述,与诸君分享心得,亦用以自勉。王静安《三十自序》有云:"举前十年之进步,以为后此十年、
全球经济背景下,市场竞争加剧与产品同质化迫使企业组织致力于探寻差异化竞争优势的新源泉.而作为新源泉的重要构成要素之一,品牌人格在中国的新经济与电子商务发展背景下又
随着科学技术的发展,火电设备趋向于高参数、大容量、复杂化,其安全经济运行对社会的影响也越来越大,伴随着电力体制改革的深入展开,各电厂必须把电力生产的安全性和经济性并
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊