基于关系数据库关键词查询的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:die0410
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展和普及,越来越多的政府、商业、金融等企事业单位和科研机构将自己的信息以及数据库系统连接到Internet上,实现信息资源的网络共享。为了获取有用的信息,信息检索技术已经广泛地应用在Internet中,并成为Internet上获取信息的主要途径。在Internet上,使用信息检索中的搜索引擎,只需要输入感兴趣的关键词,就可以得到相关性的信息,并且按与关键词的相关性进行排序。   然而现在网络中的绝大部分的信息,都存储在关系数据库中。人们习惯使用搜索引擎,用简单的关键词检索Web信息,也期望使用关键词来检索数据库中的数据,而不需要了解数据库模式和SQL。因此,关系数据库关键词查询技术(Keyword Search OverRelaTiO2al Databases,KSORD)已经成为数据库研究的热点。   本文系统地、详尽地介绍了KSORD的研究内容和现状,以及与KSORD相关的基本数据模式、查询和结果的规范化定义。在此基础上,全面总结了国内外已开发的原型系统所使用的查询结果排序函数和查询算法的两个核心技术,并指出了其优缺点。   现有的原型系统按其查询处理策略分为离线系统和在线系统两类,而在线系统又可以分为基于模式图和基于数据图两种方式。原型系统一般是以查询数据库的文本类型的数据为主,而对数字类型考虑的比较少。而在SEEKER系统中,不仅可以对文本类型数据进行关键词查询,而且可以对数字类型以及元数据进行关键词查询。   本文是在SEEKER系统基础上,进一步讨论数据库关键词查询技术。主要是从两个方面进行扩展:其一是在数字属性查询方面,引入了模糊数学的隶属函数和模糊化算子的知识,可以进行某一确定值的近似查询,并提出了相应的Top-k算法;其二是在元数据查询方面,为了在查询过程中不单独考虑元数据信息,将传统元组进行扩展成带有注释的元组,即元数据的信息直接引入到数据表中,将元数据信息当作数据表中信息的一部分,可以使用查询文本类型方法查询元数据。最后通过实验进行验证我们所提出的算法的正确性和有效性。
其他文献
随着Web2.0的兴起,越来越多的服务借助网络的力量来利用集体智慧,这是一种深远的变革。对于社会化信息的研究就显得越来越重要,因此我的毕业论文准备以Web2.0下社会化内容和
研究了高山积雪层条件对草本植物生长期的影响。对5种草本植物的生物及物候特性进行了小区间的比较试验,结果表明:积雪层消融晚的小区由于无雪期短,开花数少,果实发育期短,所
机器学习领域的许多问题都可以形式化为序列学习问题。在序列学习问题中,若干数据点构成一个前后有序的整体,每个数据点需分别赋予一个类别标签。因为序列中数据点之间存在着丰
伴随着下一代互联网的提出,很多关键技术应用得越来越普遍,CDN(内容分发网络)技术提出的目的是为了解决互联网整体带宽过剩和局部带宽不足的矛盾,给用户提供更加优质的服务。
人脸识别是一个跨学科富有挑战性的前沿课题,研究的主要内容是如何使得计算机具有辨识人脸的能力。人脸识别涉及的技术很多,其中关键在于特征提取和分类方法,本文以此为重点
三维重建是根据摄像机获取的图像信息计算三维空间中的物体几何信息,由此识别和重建物体的过程。它是摄像过程的逆问题,其输入的二维图像是三维物体几何特征、光照、物体表面
特征选择是统计模式识别、机器学习和数据挖掘等领域的一个关键问题,是从一组特征中挑选出一些最有效的特征以降低特征空间维数的过程。特征选择不仅能够降低特征维数,同时还
去年10月中旬,在辽宁海城召开了全国部分县报第三次业务讨论会。13省(区)21家县报总编辑、记者共聚一堂,着重讨论了两个问题:怎样办出县报的地方特色;加强经营管理和做好报
网络多媒体信息的安全传输越来越受到人们的关注,特别是在个人隐私、商业数据、政治军事等敏感性较高的场合,多媒体数据传输的安全性要求更高。多媒体流传输标准技术主要有基
电解质溶液中三种守恒关系是中学化学电解质溶液理论部分重要知识.从近几年高考命题不难看出,这是每年必考的内容.从高考题难度分析,历年高考题以中档题、较难题为主,重点考