基于K-mer相似性算法的DNA探针设计系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shiqingshuicai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因组数据的增长、DNA寡核苷酸合成与芯片技术的进步,寡核苷酸微阵列成为了最广泛使用的高通量分子工具之一。DNA微阵列的检测精度在很大程度上取决于DNA探针设计的好坏,因此,如何设计出具有高特异性、灵敏性以及一致性的探针十分关键。此外,如何提高DNA探针设计效率,在DNA序列数据激增的今天同样重要。本文通过分析DNA探针设计中序列比对问题的特性,提出了针对DNA探针设计的全局比对算法——K-mer相似性算法。该算法能够得到与动态规划算法Needleman-Wunsch同样的结果,但是速度达到前者的60多倍。设计并实现了基于K-mer相似性算法的DNA探针设计系统,为用户提供快速的、高质量的DNA探针设计服务。本文通过分析当前DNA探针设计软件所考虑的影响DNA探针特异性、灵敏性、一致性的因素,综合使用了低复杂度区域过滤、最大连续匹配长度过滤、探针与非目标序列最大相似性限定、DNA探针GC含量过滤、熔解温度Tm值过滤以及自由能?G过滤,以便保证所设计的DNA探针具有高特异性、灵敏性与一致性。除此之外,本系统不仅可以为每个基因序列设计特异探针,而且可以为不存在特异探针的序列设计组探针。在文章最后,我们对DNA探针设计系统进行了测试。首先,分别对DNA探针设计系统的主要模块进行了功能测试,测试结果表明,系统的各个子模块表现良好,基本达到设计要求。然后,对系统的核心算法进行了测试,并与DNA探针设计系统中常用算法进行了比较,结果表明,本系统所采用的算法在保证准确性的同时,具有较高的效率。最后,对系统的总体性能进行了测试,与现存DNA探针设计软件相比,本系统在满足高精度的情况下具有很不错的性能表现,是进行DNA探针设计的良好选择。
其他文献
道路网综合问题是地图综合领域乃至地图学研究领域的核心热点和难点之一,具有重要的研究价值。作为城市道路网的重要道路类型之一,主干道体现了一座城市的结构模式和道路的建
月球探测经历了几十年的努力,积累了大量的数据资料,而且是通过遥感探测手段获得的。Apollo时期载人登月的成功实现为进一步认识月球提供了珍贵的样品和直接测量数据,由阿波
伴随着经济的快速的发展,我国的石油开采量日益增加,随之而来的环境污染问题日渐显著。近年来,植物修复技术被越来越多的应用在修复石油污染土壤等领域,但关于植物是如何耐受
第一部分 来源于Caldicellulosiruptor bescii DSM6725菌株的嗜热多聚半乳糖醛酸酶的表达、纯化和结晶学研究果胶酶是以水解半乳糖醛酸由α-1,4糖苷键聚合而成的多糖链为底物
本研究以转碱蓬脱水素基因(DHN)的烟草、野生型烟草为材料,分别在DNA分子水平,蛋白表达水平及生理水平对转基因植株进行了检测,以期获得可遗传的转碱蓬脱水素基因(DHN)植株,
氢型丝光沸石(H-MOR)催化二甲醚(DME)羰基化反应是由合成气经二甲醚制乙醇工艺的重要步骤,其关键在于提高DME转化率和H-MOR的稳定性。金属元素改性是提高H-MOR催化活性和寿命的重
本研究实验材料为强耐寒性植物新疆沙冬青,对编码耐寒相关蛋白酶的AnGPAT基因进行分子克隆及序列分析,构建了转入AnGPAT基因的大肠杆菌原核表达载体、毕赤酵母真核表达载体并
我们知道正则半群凭借其丰富的正则性在半群代数理论中占据重要地位,但是对众多图的自同态正则性难以给出一般性的回答,所以针对具体图类给出具体答案成为刻画自同态正则图的
本文研究了C*-代数中的由林华新提出的一种正元比较.总结了这种正元比较的基本性质及其等价定义.作为应用,我们证明了迹拓扑秩的几个等价定义.
辐射空调系统以其在节能性、舒适性和美观性方面的良好表现得到广泛关注,但地板辐射供冷的研究和应用起步较晚,国内外学者在其室内环境及系统负荷方面的研究仍不完善,且对地板辐射供冷技术在我国寒冷地区的应用适用性评价较为缺乏。本文采用理论分析、实验研究与仿真模拟相结合的方法,对地板辐射空调系统的室内环境特征及负荷特性与建筑空间设计参数的关系进行研究,并从舒适性和节能性角度对地板辐射供冷技术在寒冷地区的性能表