【摘 要】
:
数学表达式是科技信息的重要表达形式,实现数学表达式检索有助于科技信息的高效交流与利用。针对数学表达式复杂二维结构特性所导致的普通文本检索技术难以对其进行检索的问
论文部分内容阅读
数学表达式是科技信息的重要表达形式,实现数学表达式检索有助于科技信息的高效交流与利用。针对数学表达式复杂二维结构特性所导致的普通文本检索技术难以对其进行检索的问题,提出一种面向表达式层次结构的分层索引模型和检索方法。在数学表达式索引研究中,通过提取数学表达式基线层次结构,定义表达式主层次并以各表达式主层次结构信息为依据,对数学表达式资源进行聚类处理,形成具有相同主层次结构的表达式集合;基于此集合,运用Treap数据结构建立数学表达式索引,成为表达式索引层。同时,结合文件倒排记录构造文件索引层,从而建立了面向数学表达式匹配和面向文档信息获取的双层索引结构。在与该分层索引模型相应的检索方法研究中,设计了包括精确匹配和结构匹配等数学表达式查询方式的检索算法。通过实验对该分层索引模型和检索方法进行了验证,表明本文提出的面向数学表达式层次结构的分层索引模型和检索方法对数学表达式二维结构特性具有较好的有效性和适应性。
其他文献
二十世纪中期,随着第三次工业革命的发展,信息技术在世界范围内呈现爆炸式的发展。而随着金融信息化的发展,遗留系统带来的各种问题也开始逐渐凸显。这些遗留系统往往已经开
计算机网络与无线通信技术相结合产物无线局域网(WLAN)作为轨道交通数据通信系统应用的研究已经成为重要发展趋势,切换问题是其中的一个热点研究问题。由于WLAN中无线电台功
支持向量机是在统计学习理论的基础上发展起来的一种机器学习方法,其理论基础是统计学习理论的VC维和结构风险最小化原理。目前,研究人员对支持向量机进行了广泛的研究,并且
网格计算的主要目的为整合互联网上广域的、异构的网络资源,实现跨域的协同工作和资源共享,为用户提供透明的计算能力。为了有效利用网格环境中的海量资源使得在尽量短的时间内
当前,随着城市交通需求量日益增大,交通拥挤等问题严重影响了城市环境。公共交通与其他交通工具相比,具有载客量大等无法比拟的优点,实现公共交通的智能化管理,提高公共交通
随着商业环境的快速变化,以及技术的不断创新,各个行业里的遗留系统面临着越来越大的生存压力。为了改变遗留系统的这些现状,从20世纪90年代以来,涌现出了许多解决办法,大量
互联网的便捷性和跨地域性,使它成为民众表达意见、讨论公共事务、参与政治经济决策讨论的公共平台,伴之而来的就是网络舆情的收集和管理问题。网络舆情具有的传播速度快、地域
模型驱动体系架构(Model-Driven Architecture, MDA)是OMG组织于2001年3月提出的一种新的软件体系结构方法学,其核心思想是抽象出与实现技术无关的平台无关模型(Platform Ind
空间数据模型作为空间数据信息组织和管理的理论基础,在推动GIs发展的过程中起了重要作用。空间数据模型的发展经历了三代:CAD数据模型、Coverage数据模型、Geodatabase数据模
数据爆炸性的增长,面对几何性增长的数据,我们的个性计算需求也日益加强,具有高计算能力的云计算正被大众所接受。云计算服务因其提供的服务成本低并且质量高,不断受到大众的