论文部分内容阅读
生物信息学(又称生物计算学)是一门生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科,其主要任务是揭示海量生物学数据中蕴含的生物学意义、探索生命活动的奥秘。Motif Finding和Closest String问题都是生物计算中基础而重要的研究问题,在很多领域得到了广泛的应用,甚至生物计算以外的编码理论。近年来这两个问题得到了广泛的研究,如何应用最新的研究技术,如分布式系统和固定参数理论,为这两个问题提出更好的解决方案是本文研究的重点。论文在深入分析已有算法的基础上,提出了Motif Finding问题的分布式算法,并设计与实现了分布式系统,对问题进行有效求解,实际测试结果表明分布式算法是正确且高效的;综合已有算法的优点,提出了计算广义Closest String问题最优上界的新方法,对Closest String问题的下界进行了推导,设计并优化了下界相关算法,弥补了固定参数算法在d较大且不存在结果时运行时间太长的缺憾,为判断在下界是否存在结果和求所有解提供了快速有效的方法。论文对算法的设计思想及实现作了详细的说明,对测试结果也作了深入的分析,实验结果表明这些算法是可行且高效的。