论文部分内容阅读
目的优选对人类RNA聚合酶(P01)Ⅱ启动子数据识别分类并提高识别准确率的方法。方法采用基于知识的统计编码方法、CpG编码、五联体(Pentamers)编码、模式字典(Pattern Dictionary)编码,最后建立共识模型,使用支持向量机(SVM)方法对启动子数据进行分类。结果启动子数据编码后在SVM中识别,与其他利用SVM工具相比,得到了较高的识别准确率、特异性及灵敏度。将新编码方法应用到人类22号染色体启动子数据的识别中,其中模式字典编码识别准确率达到了90.98%。倍论共识模型考虑了各子模型的