论文部分内容阅读
了解真核细胞中细胞核内蛋白质的定位情况对于新发现蛋白质的功能注释具有重要意义。随着蛋白质数据库中蛋白质序列数量的急速增加,采用计算方法来预测蛋白质亚核定位已经成为蛋白质科学领域研究的热点。根据Chou提出的伪氨基酸组成离散模型,提出了一种新的蛋白质亚核定位预测方法。计算蛋白质序列的近似熵作为附加特征构建伪氨基酸组成,表示蛋白质序列特征,AdaBoost分类算法作为预测工具。与已报道的亚核定位预测方法的性能相比,这种方法具有更高的准确率。