论文部分内容阅读
本文详细分析了数学公式的逻辑结构特点和现有数学公式检索系统所采用的检索机制,并结合当前数学公式检索系统的研究成果,进行了关于数学公式索引和检索方面的研究工作。首先,通过摘除运算数节点,给出了数学公式逻辑结构子树LSSub-Tree的概念以及相关算法描述;其次,通过LSHash算法对LSSub-Tree的索引字符串进行散列映射,构建数学公式索引LS-Index;再次,以此为基础,采用倒排索引作为索引策略,并使用B+树作为查找树,建立基于Apache服务器的数学公式检索原型系统;最后,使用运算数信息集,也就是LSSub-Tree的补集,引入编辑距离作为相似度衡量基准,对检索结果集进行排序。通过实验验证了所设计检索机制的可行性和有效性。