论文部分内容阅读
在一个字符串集合中,通过一些字符串的相似性函数寻找与查询字符串相似的字符串集合被称为字符串的近似查找。这种查找常应用于数据库、信息检索等各个领域。但是在某些特定的情况下,需要考虑字符串在查询中的重要性,即权值。针对这种同时考虑字符串相似性与权重的查询,在字符串集合中选择最佳的查询结果。首先提出了一个分为两步的Dtree算法处理这样的查询,并在两个步骤中设计了基于树状的索引结构来支持这样的查询。在真实的数据集上进行了实验,实验结果表明该算法优于传统的基于倒排表索引结构的Top-k查询算法。