一种基于尾匹配q-gram的近似串匹配算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:qiuzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近似串匹配是生物信息学、文本检索、信号处理等领域的一个基础问题,如何提高近似串匹配的速度一直都是研究的关键问题.提出一种新的在大文本库中快速查找近似匹配的无损过滤算法.为保证在大文本库中的匹配速度,本算法使用了查询速度较快的q-gram索引.为通过提高过滤算法的过滤效率达到提升算法整体性能的目的,详细分析了含有匹配串的文本区域,提取了一些基于尾匹配q-gram特征的新过滤条件,然后用这些特征优化了过滤算法的过滤标准.实验数据表明,新过滤条件有效地提高了算法的过滤效率,提升了算法的整体性能.结果显示新算法适
其他文献
移动对象的运动基本是在障碍空间里进行的.近几年,已有较多针对障碍空间中范围查询、近邻查询、聚类查询等的研究,但是目前尚没有对障碍空间中移动对象的位置预测进行研究.为
一、高校基建档案的特点1.专业性。集中表现在基建档案的形成领域和内容性质都具有鲜明的专业性特点。
人事档案是党政机关、企事业单位在管理所属人员时形成的以个人为单位集中保存的一种特殊的专门档案,是全面、历史地考察了解一个人和党的组织工作、人事工作不可缺少的重要参
档案编研工作作为档案业务建设中的一个重要组成部分,已在档案界引起高度重视。近年来,随着《档案法》的深入贯彻实施,全社会档案意识的普遍增强,企事业单位档案工作进入了一个新
构建社会主义和谐社会是我党执政理论的升华,其根本任务就是要形成全体人民各尽所能、各得其所而又和谐相处的社会。社会主义和谐社会,就是以人为本的社会,档案作为记载人类思想
一、电子档案管理的现状及问题的根源1.对电子档案管理的认识存在一定局限性电子文件之所以涉及范围迅速扩展、数量急剧增加,最主要的原因就是计算机网络化的快速发展。多数办