论文部分内容阅读
确定蛋白质的亚细胞位置对于了解蛋白质的功能以及药物设计具有重要作用。在后基因时代,测序序列呈现爆发式增长,而传统实验手段无法满足海量蛋白质的亚细胞定位需求。将蛋白质亚细胞定位问题引入到机器学习领域可有效解决该难题。本文提出基于PSSM-MLSMOTE方法的革兰氏阴性菌蛋白质亚细胞定位预测。首先使用AAO和PSSM-AAO方法对蛋白质序列进行特征提取,并将两种算法融合。然后采用MLSMOTE方法平衡数据集,最后将处理后的数据集输入MLkNN算法分类器中预测蛋白质的亚细胞位置。通过jackknife检验,总体