面向分析处理的关键字查询性能优化技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:woshixgq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web搜索日益被人们接受和使用,关键字查询成为了查询文档和网页的最简单、最流行的信息检索技术。由于应用需求的推动,关系数据库上的关键字查询(KSORD)成为近年的热点研究领域。普通用户只需要使用简单的关键字查询就可以访问关系数据库,而不用知道或理解数据库模式,也不用懂得书写SQL查询及学习和使用关系数据库的定制查询界面。本文所研究的面向分析处理的关键字查询(KDAP)就是KSORD的一个研究方向,它把OLAP分析与关键字查询相结合,通过一步步的导航发现用户感兴趣的事实和数据,最后以报表的形式展现给用户。虽然面向分析处理的数据库关键字查询已展开研究,也出现了一些原型系统,但是其查询效率还没有引起人们的关注。当查询关键字个数比较多或数据库模式比较复杂时,KDAP系统的查询效率就会变得很低。本文从基于模式图的KSORD出发,研究了KDAP系统的查询过程,主要分为两个阶段:候选了空间的生成和候选面的构造。候选子空间基于模式图进行即时查询,当关键字个数较多或数据库模式复杂时,候选了空间的即时生成就会耗费大量的时间,从来严重影响系统的查询效率。另一方面,候选面构造的过程中,系统要对每一维的属性和属性实例计算聚合值,再进行排序,如果维中属性过多或者事实表庞大,候选面的生成效率会大大降低。因此,本文针对KDAP系统,首先研究了其查询体系结构及查询模型,然后分析了查询过程中存在的效率问题,从而进行了性能优化技术的研究,并提出了两种优化KDAP查询效率的方法。本文的主要工作和创新点在于:1、提出一种基于数据库模式图的候选子空间预处理方法。该方法通过预处理数据库模式图,并把处理之后的候选子空间模式存储在数据库中,避免了系统在查询时临时生成候选子空间,大大减少了KDAP系统生成候选了空间所需的时间,从而提高了KDAP系统的查询效率。2、提出了一种候选面生成的优化处理方法。该方法首先对候选了空间进行处理生成划分集合,将得到的划分集合看作是一个文档集,集合中的每一个实例面看作是一个超级文档,然后利用空间向量模型计算查询与文档之间的相似性,选择那些最有希望的实例面进行聚合计算。该方法减少了需要进行聚合计算的实例面个数,达到了提高KDAP系统查询效率的目的。
其他文献
Ad hoc网络是一种没有固定结构的自组织无线网络。它的每一个节点都可以自由移动,同时具有主机和路出器的功能,向其它节点发送数据包。随着多媒体应用的兴起和Ad hoc自身的商
随着移动通信技术的发展与移动终端性能的提高,基于智能手机等移动终端的实时流媒体技术已经成为人们关注的热点。本论文的主要研究内容是基于windows mobile智能手机平台的
在汽车电子技术飞速发展以及市场竞争越发激烈的形势下,汽车电控单元的功能需求日益复杂,性能要求越来越高,同时对其开发周期的快速性要求也越来越高。代码生成技术的出现在一定
随着网络技术的发展,电子邮件成为人们日常通信的重要工具之一。网络用户通过电子邮件获得很多资讯,其中一部分信息是用户感兴趣的,也存在一部分信息是用户不感兴趣的。能为用户
随着“数字化校园”的推进,校园网中各业务系统对数据共享的需求日益增多。但是由于在校园网信息化建设的早期,校园网的信息化建设缺乏统一的规划,各部门的业务部门根据自身
随着信息科技的飞速发展,人们对于信息的安全性需求变得越来越迫切,加密解密是信息安全中的关键问题。然而加密算法安全性的提高和数据集规模的增长降低了暴力破解的速度和可行
当前我国各级政府在“中国电子政务上程”号召下,都存进行信息化网络建设和办公自动化业务改造,实现政府各级部门之间、政府与政府之间、政府内部的信息网络互联互通,在强化政务
双目立体视觉基于视差原理,主要研究如何从(两幅或者多幅)图像里获取场景中物体的距离(深度)信息。其中一个重要研究问题是立体匹配,即如何在多幅图像中确定对应点。随着大量
虚拟校园是虚拟现实技术在现代教育领域的重要应用,虚拟现实是一个由计算机产生的三维立体空间,用户可以与这个空间中的对象交互,观看以及操作,并可在空间中自由移动,进而产生身临
如何有效分割复杂场景图像,一直是计算机视觉领域的研究热点之一。在分割含有未知噪声及灰度分布不均匀或异质的复杂场景图像时,目前很多分割算法要么无法进行精确分割,要么分割