论文部分内容阅读
XML关键字搜索是一个用户友好的信息发现方法,非常适用于XML文档不存在schema的情况,但问题是用户在关键字搜索中很难准确地表达搜索语义。现有的主要XML关键字搜索的研究是基于SLCA(最小最低公共祖先)方法,但该方法可能会丢失一部分有意义的结果。提出一种新的基于语义距离的模型,更全面地考虑XML文档结构的语义特性;在该模型的基础上,设计了多种算法将彼此语义相近的关键字结点聚集在一起形成XML关键字搜索结果,并用大量实验对几种算法进行了比较。