多功能酶分类预测中的特征表达与融合算法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:fllmn2585
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多功能酶作为一种生物催化剂在生物的各种反应中都起到了非常重要的作用。正确区分多功能酶在基因工程和细胞工程中能起到关键性作用。本文目的是通过多标签分类器对多功能酶进行功能预测,由于多功能酶的预测受到数据集、特征表达、分类器的选择影响,因此,本文从这些方面展开了研究工作。具体研究工作如下:(1)多功能酶的研究中前人构建的数据集同源性太高,在对低同源性多功能酶进行预测时精度不是很高,因此,本文构建出了较低同源性多功能酶数据集进行多功能酶的预测。(2)针对特征表达,本文提出了多重进化信息PSSM矩阵。多重进化信息PSSM矩阵相对于传统的PSSM矩阵能够表达出多功能酶序列的更多进化信息。本文还结合二维Gabor变换对PSSM矩阵进行局部特征提取。通过Gabor变换可以将PSSM矩阵进行多尺度、多方向的分解,因此,能得到PSSM更多的信息。相对于现有的基于PSSM矩阵的特征提取法(DPC-PSSM)本文的方法在分类效果上有一定的优势。基于氨基酸序列特征表达中,本文提出了二肽局部词特征提取法,提取到的特征相对于AAC、AmPseAAC有更好的效果。(3)针对实验中得到的多种特征信息,本文进行了特征融合。首先。运用特征抽取融合方法进行特征的融合,在特征抽取中运用到了递归特征消除法(RFE)。其次,将融合后的数据进行归一化和除冗余。经过处理后的融合特征数据在召回率、精度、F-值和平均精度这四种指标上能达到92.21%、93.73%、91.11%、97.68%。(4)针对多功能酶分类预测问题,本文使用了随机K标签集成分类算法,在随机K标签分类算法中基分类器的选择上做了详细的讨论。本文中分别用了支持向量机分类模型(SVM)、K近邻分类模型(KNN)、贝叶斯分类模型(NB)、随机森林分类模型(RF)四个分类器进行实验。通过五折交叉验证以及四种评估指标对这些基分类器进行分析,发现随机森林作为基分类器取得的性能最好。本文构建的模型与其它多标签分类模型相比,能取得比较良好的分类效果。
其他文献
矿物绝缘油作为高压电气设备主要液体绝缘介质已在电力系统内得到了广泛应用,随着对环境保护以及防火性能的要求越来越严格,酯类液体电介质开始应用到电力设备绝缘当中。目前
目的:对于缺血性脑卒中患者,通过常规MR检查联合三维时间飞跃发磁共振血管造影(three dimensional time of flight method,3D-TOF)、扩散加权成像(Diffusion Weighted Imaging,DWI)、磁敏感加权成像(susceptibility weighted imaging,SWI)和三维动脉自旋标记成像(arterial spin labe
在现代战争中,协作体系作战能力的重要性不容小觑。多节点无线通信是协作体系作战的基础,自组织网络技术在协作体系作战中起着至关重要的作用,而高效的无线通信资源管理是为
今年5月以来,我国铅蓄电池行业经历了“刮骨疗伤”式的整治,因重金属污染问题,铅蓄电池行业被推到风口浪尖,大批企业被关闭,复产者寥寥无几。时至今日,铅蓄电池行业的“整肃风暴”
报纸
分析阵面安装误差对相控阵雷达测角精度的影响,对研究和设计高精度相控阵雷达非常重要。建立了相控阵雷达阵面安装误差-测角精度误差模型,分别仿真分析了阵面倾角安装误差、
光学综合孔径成像系统是把数个小孔径的光学元件根据一定规则的空间位置进行排列,通过光路的调整、相位的匹配等操作,使经过各子孔径的光束在同一焦平面上达到共相精度0.1λ。叠堆压电陶瓷能实现长度方向纳米级的位移控制精度。本文选用叠堆压电陶瓷管并填充透明液体介质,设计了一种结构紧凑的光学调相器并实现了制备输出。采用干涉仪检测相位并使用条纹偏移标记图像处理法,获得了对前述调相器精度达到0.05λ的光学相位检
变分不等式是最优化领域一类非常重要的研究工具,它有着广泛的应用背景。经济中的平衡问题、统计与机器学习中的很多问题、交通运输问题、凸规划问题等都能用变分不等式来描
通过CFD仿真与试验相结合的方法研究风扇偏置对散热系统性能的影响。研究结果表明:风扇偏置虽不会造成散热器迎风面总体风速急剧变化,但会对散热系统总体性能产生一定影响:风
目前,民办教育企业正处于高速发展时期,各种资本投入使得民办教育企业规模迅速扩大。在如此巨大的利益与风险并存的情况下,如何控制、规避财务风险,如何实现低成本高效益,是
岩石的单轴抗拉强度是岩石的一个重要力学参数。四点弯曲试验法是获取岩石单轴抗拉强度的一种间接方法,但四点弯曲试验的传统公式计算出来的单轴抗拉强度往往比实际的单轴抗