分布式关系数据库上的关键字查询

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wwp8133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息飞速增长的时代,分布式数据库成为大型企业存储信息的首选方式,方便快速的查询关系数据成为一个科研难题。随着网络技术和搜索技术的兴起,关键字查询与传统的SQL查询相比,显示出巨大的优势。首先用户不需要知道数据库的模式信息;其次用户不需要掌握复杂的数据库查询语言,如SQL等。如何将关键字查询技术运用到分布式数据库上就变得格外重要。本文主要研究分布式数据库上的关键字查询问题。本文首先提出单数据库上的关键字查询算法。该算法首先给出了一种新的相关性评价函数,新的评价函数重新定义了元组对关键字的包含关系,通过分析数据库模式与查询内容的语义信息来评价元组与查询关键字的相关性;接着基于新的评价函数,提出基于数据块迭代的TOP-K查询算法,该算法通过对未产生结果分值的估计有效的降低了算法的IO时间。本文接着在单数据库查询算法的基础上,提出了分布式数据库上的关键字查询算法。该算法首先给出了分布式数据库的数据模型,该模型之上关键字查询的结果定义以及适应于分布式环境的结果评价函数;接着提出扩展的连接表达式生成算法;为了降低分布式环境下查询的执行代价,设计了过滤无效查询的可达性索引以及索引的更新策略;最后给出了分布式环境下的TOP-K查询算法。基于以上提出的算法,设计并实现了真实分布式数据库环境下的关键字查询系统。该系统可以有效的支持单节点以及多节点上的查询。在该系统下,我们从多个角度设计了实验内容,实验结果表明本文算法在精确性和高效性都有所提高。
其他文献
随着模糊集合理论广泛应用于社会生产和生活中的各个领域,模糊关系数据库理论的研究与应用应运而生,但是由于模糊数据的特殊性,传统关系数据库管理系统己经不再适合处理这些
重新审视传统的网络架构,许多传统网络时分层的,多数以树形结构布置了众多的以太网交换机。当以客户端-服务器为主体时,这种设计是合情合理的,但是对于如今的企业数据中心、校园
印刷体数学表达式识别系统主要包括数学表达式定位、数学表达式符号识别、数学表达式结构分析和数学表达式重构四个组成部分。数学表达式定位是数学表达式识别的首要步骤,也
指代消解是自然语言处理中的一个基础性问题。指代消解在命名实体识别与跟踪、关系抽取、问题回答等任务中有着重要的作用。共指关系是指代关系中的等价关系,本文针对中文共
视觉注意建模是生物心理学、神经计算科学的主要研究内容,同时对计算机视觉、人工智能、模式识别和多媒体内容分析等多个领域的理论和技术发展有很强的促进作用,近年来正受到越
随着教育体制的改革,提高全民素质,高校招生名额每年以30%的速度递增。而各个高校在原有的硬件,软件条件下,学生人数都不同程度的按比例增加,为了保证教学质量,最大程度的发
学位
产业链协同SaaS (Software as Service)平台是一个主要面向中小型制造业的第三方服务平台,为众多的以制造业企业为龙头与众多协作供应商、经销商、维修服务商形成的企业联盟
万维网改变了人们彼此交流的方式,然而绝大部分现有的网络内容只适合于人工处理,虽然一些软件工具在一定程度上改善了人类的交流方式,但是在某些方面还有些欠缺,例如:搜索结果
智能交通系统(Intelligent Transportation System,ITS)是以缓和道路堵塞和减少交通事故和交通污染,提高交通利用者的方便和舒适为目的,利用交通信息系统、通讯网络、定位系统