多模型下的近似字符串匹配算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xiaojas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近似字符串匹配是模式匹配研究领域中的一个重要问题。近年来,随着各学科的迅速发展,在许多不同背景下对于近似串匹配问题的研究逐渐受到人们的关注特别是在计算生物学等新兴学科中,有许多近似串匹配的新模型被陆续提出。一方而,这些模型在各学科中均有非常重要的应开用;另一方而,由于这些模型被提出的时问大多不长,因此对它们的研究并不充分。因此,对不同模型下的近似串匹配问题进行研究就成为了在模式匹配和诸多相关领域中的研究重点和难点。针对这一现状,研究的主要内容就是三种近年被提出的模型下的近似串匹配问题。这三种模型分别是:属性匹配模型,交换匹配模型以及块匹配模型。针对属性匹配,提出了一种新的索引结构CIDS-PIP (compressed indexed data structure for property indexing problem)及相应的匹配算法。在该算法中采用了压缩后缀数组作为核心的索引结构。为了进一步降低索引的空间开销,针对不同的属性规模,提出了两种解决方案。针对这两种方案设计了不同的辅助索引结构,以同时满足较高的查询效率和较低的空间开销。与现有的支持属性匹配的索引相比,CIDS-PIP的空间开销更低。针对交换匹配,提出了一种新的离线匹配算法,并证明更精确的模式交换版本的个数上限。该交换匹配离线算法是建立在已有的全文索引的基础上,而非设计全新的索引数据结构。在该算法中,采用后缀数组或压缩后缀数组作为索引结构。当模式长度较小时,该算法可以达到良好的时间效率,并明显优于现有的属性匹配在线算法。此外,还解决了近似交换匹配问题。实验证明,相对于已有的在线交换匹配算法,该算法的时间效率大幅提高。块模式匹配模型是Julio N等人在2011年提出的一种匹配模型,现在在此基础上进行的研究并不多见。针对在线和离线两种情况下的块模式匹配问题进行了研究,并且分别给出了新的算法。相对于现有的在线匹配算法,新的在线算法需要更低的空间开销,而时间开销并没有增加。相开对于现有的离线匹配算法,新的离线算法的时间效率更高。与此同时,还指出了在Julio等人论文中的一处不正确的表述,并对其算法的时间复杂度进行了修正。此外,对块模式匹配问题的两个衍生问题:融合块模式匹配问题和突变块模式匹配问题进行了研究并提出了新的算法。
其他文献
美学早已渗透于各个学科的教学中,数学教学也不例外。将美学融入到数学教学中可以激发学生学习兴趣,促进教学环节的开展。
作为一门中职学生必修的课程,职业道德与法律学科的重要性毋庸置疑。为此本文从中职职业道德与法律教学现状出发,针对“如何提高中职职业道德与法律教学的实效性”这个问题提出
采用BT—LYR注意能力测试软件(1.0版)对我国54名蹦床运动员的注意进行测试,分析注意的影响因素。结论:1)高水平蹦床运动员的注意集中稳定和注意转移水平较高是由于蹦床项目的特点和
少儿期是语言发展的关键期,传统的少儿语言教育注重的是口语能力的培养,而忽视书面语言的教育,进行的不是完整语言的教育,使少儿在认识世界的过程中少了一个非常重要的通道。让少
职业道德修养是教师应该具备的基本条件,新课程实施的时代呼唤教师职业修养不断提升。加强农训中小学教师职业修养要坚持知行统一、自律和他律结合等原则,明确职业修养的具体内
对于语言学习者来说,听说能力是语言学习的四大基本技能之一,是学好语言的关键。大学英语听说课是一门培养学生听说技能的课程,如何提高大学英语听说课的教学效果,成为英语教
目的:通过观察复方中药八珍加肉桂补骨脂汤对运动疲劳大鼠海马BDNF及其受体TrkB表达水平的影响,探讨该方药对运动疲劳的神经生物学机制。方法:70只SD大鼠随机分为3组:对照组,模型
静脉溶检治疗登记的meta分析提示】30%病人在AMI症状出现后6~24h住院,这些病人采用晚期再灌注治疗是否能使梗塞相关冠脉再通和是否有益。
氯胺酮麻醉引起呼吸循环的严重抑制,抢救无效,导致死亡尚无报道。我们经遇1例,报告如下。 女性农民,39岁.10前因翻车致左下肢不能活动。经x线检查证实为左髋关节脱位。