论文部分内容阅读
启动子是基因转录调控机制中最重要的调控区域,启动子区域内转录元件的识别是揭示基因表达调控的重要基础.快速,可靠的启动子预测算法对于广范围内启动子元件的识别能够提供很大的帮助,目前的启动子识别算法及预测软件普遍存在假阳率高的缺点,因此改进识别算法的泛化能力显得尤为重要.本文利用从PlanPromDB数据库上下载的启动子数据,在深入分析启动子GC—Skew偏好、特异性位点保守性及TSS—TIS距离分布的基础上,通过改进原有位置权重矩阵(PWM)模型,构建出能够同时考虑位点保守性和关联性的位置关联性权重矩阵(P