数据空间中基于关键字的结构化数据查询方法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:mmmzyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,数据空间中的信息呈现出多元化和高速化发展趋势,人们关注的焦点不再是信息的来源,而是获取信息的方式。但是,由于数据信息的海量性、异构性和分布性等特点,如何快速、高效地获取有用的信息便成为数据空间面临的一个严峻挑战。而关键字查询的便捷性促使它成为访问信息的主要方式,因此,研究数据空间中基于关键字的查询方法具有重要意义。关键字查询由于简单、易用等特性而深受用户欢迎,并且已经被成功地运用到关系数据库中。这种查询方式将用户从技术细节中解脱出来,它无需用户掌握结构化查询语言和数据库的底层结构。当前的关键字查询策略主要有斯坦纳树、元组单元和候选网络,但是,它们只返回包含关键字的元组或元组树,因而不能提供与查询关键字有关的综合性信息。然而,有时用户可能对与查询关键字相关的信息更感兴趣,所需要的查询结果不再局限于单个元组,它可能是由多个元组构成的元组连接树,元组树中的某些元组可能并不包含查询关键字。因此,上述查询方法返回的查询结果无法符合用户的查询需求。针对用户的需求,本文提出了一种基于实例摘要的查询应答方法(ISQAM),该查询方法返回一个实例摘要树(IST)作为查询结果,它含有一些具有潜在意义的信息。为了生成实例摘要树,ISQAM还引入了紧密度的概念来过滤关系和属性从而减少一些不必要的开销。与传统的关键字查询相比,实例摘要树包含与给定关键字相关的所有信息,它使查询结果更加丰富。此外,为了对实例摘要树进行排序,本文还提出了一个综合排序函数来计算实例摘要树的排序得分,从而返回与查询相关性较高的实例摘要树作为查询结果。最后,本文分别在大数据集和小数据集上进行了一系列实验,实验结果表明该查询方法返回的实例摘要树具有较高的查询质量。
其他文献
人体生物认证在现实生活中起着重要的作用,而虹膜作为人体的重要特征已经成为身份识别的重要特征。本文在虹膜图像预处理、虹膜特征提取与编码、模式匹配与分类器设计等方面
随着生产的发展,机械故障诊断的重要性越来越明显。传统的诊断技术和理论方法对于具有多故障、多过程、突发性故障的现代化机械设备,往往显示出较大的局限性,难以从大量的故障信
随着计算机网络技术的不断发展,网络安全问题变得日益严重,防火墙技术是保护网络安全最有效的技术之一。基于流过滤的防火墙是一种新型的防火墙,它不仅能像包过滤防火墙那样
密码学(Cryptology)是信息安全的核心技术,密码函数的设计与安全性分析成为现今研究的热点之一。密码算法按其加密方式可分为流密码和分组密码。它们的安全性与其核心设计部
近几年来,基于移动对象位置,为用户提供快捷便利信息的移动信息服务受到服务提供商和用户地追捧。如何有效管理移动对象的位置信息已成为市场关注的焦点,同时也是数据库领域
随着人类对自由通信的无限渴望,近几年来网络通信的发展与日俱增,尤其是无线网络技术的发展。人们可以通过配有无线接口的变携式移动计算机或者其他带有无线传感器的网络设备进
当前,随着人们生活节奏的加快和工作压力的增加,心脏系统疾病发病率持续上升,且患者年轻化趋势越来越明显,它已经成为人类生命健康的主要威胁。医院现有的软硬件资源很难在短
1982年波兰学者Z.Pawlak提出了粗糙(Rough)集。它是一种处理不精确和不完备信息的数学工具,而且不依赖于数据集之外的任何附加信息。经历了近20年的发展,已经在理论和应用上取得
随着互联网技术的飞速发展,通过搜索引擎或者Web网络来获取信息,已经发展成为人们工作和生活的习惯。由于用户查询通常仅仅由若干个单词组成,导致查询不能清晰准确的表达用户
信息粒和粒计算是近几年国际上发展较迅速的一个学科,它在许多方面都有其特别的理论意义和应用价值。 本文详细分析研究了粒计算的基本理论与技术,并将其应用于模式识别特别