数据仓库查询技术的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:yiyiweiwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今世界范围内的商业环境和竞争节奏发生急剧变化,从客观上提高了企业对商业智能和数据仓库的依赖和需求。数据仓库查询技术是商业智能的重要组成部分,传统上,数据仓库的信息消费者主要通过浏览定制后的报表的方式使用数据仓库,但对于非技术人员,传统的查询技术一般难以掌握或者存在某些易用性上的不足。究其原因,是由于数据仓库系统缺乏高效的人机交互方式。 本文提出采用数据仓库中文查询结合传统OLAP查询的方式,可大大改善人机交互的效果。中文查询提供了用户直接以人类语言(而不是人工语言或机器语言)的方式向数据仓库系统发问以获得所需的信息,从而大大改善了人机交互的容易程度。但由于技术上的不成熟,中文查询并不能保证其绝对的正确性,其查询结果可能只能是接近用户的查询原意。OLAP查询可在中文查询的基础上,通过基本的OLAP操作,达到用户查询的原意。 本文总结了OLAP可视化和数据仓库标准查询接口,研究了数据仓库中文查询的关键技术,开发出数据仓库中文查询系统IChilqDW,IChilqDW通过词汇知识提取和词汇知识学习获取有关具体的数据仓库领域内的中文查询语句语义,将中文查询语句转换为OLAP标准查询语言MDX,然后执行MDX,获得用户查询的OLAP结果。 在中文查询语句转换为MDX语句的算法中,IChilqDW中提供了基于语义依存和基于中心词最近匹配原则两种算法,均达到了较好的准确率和运算效率。 文章提出以中文查询技术结合传统的OLAP技术,以改善数据仓库查询的人机交互效果,具有一定的创新性。由于现今国内外几乎不存在对数据仓库自然语言查询的研究,数据仓库中文查询系统IChilqDW的提出和实现对于数据仓库查询技术具有一定的开创性意义。 IChilqDW提供的基于语义依存和基于中心词最近匹配原则两种转换算法,是对自然语言处理理论和中文信息处理理论的具体应用,对于该领域有借鉴作用。IChilqDW的目标在于使人们可以更容易、更方便地使用计算机和数据仓库,它的提出和实现具有一定的现实意义。
其他文献
任何民族的发展都不能没有继承。而我国大量的优秀传统文化均以古代汉语为载体。中华文化要传承、要变革,就需要有一批人读文言文,整理古籍,研究历史。然而,由于客观历史条件的限
随着嵌入式系统在日常生活中日益广泛的应用,嵌入式系统中的数据存储和数据管理越来越得以重视。具有高存储密度和高存储速率特点的Nand Flash作为嵌入式产品中极具发展潜力
因特网迅速发展,搜索已经成为网络的主要功能。一个搜索引擎拥有海量的数据,并且能在海量数据中迅速找到符合搜索条件的数据。然而如何在做到以上功能的前提下,实现海量数据与目
人脸识别技术是一种方便实用的基于人类生物特征的身份识别技术,有着迫切的现实需求和广阔的应用前景。然而目前的人脸识别技术还有许多地方不完善,光照、姿态、遮挡、以及小样
本文首先介绍了课题研究的技术背景,移动IPv6技术以及快速切换。快速切换(Fasthandover)是移动IPv6技术中的一个关键技术,是对移动IPv6协议的扩展,采用预先切换和基于隧道的
随着Internet技术的不断发展和跨平台需求的日益增加,Web服务应用越来越广。它是一种自包含的、基于网络的、分布式的模块化组件。目前,对于Web服务描述与服务组合描述生成技
在线教育、智能教育是教育的未来,它们正逐步改变着教育的现状。在在线教育系统中,学生的答题和教师的阅卷是不同步的,学生答题的结果的正确性不能得到及时有效地反馈,为了有效地
随着网络和通信技术的迅猛发展,以及计算机应用规模的持续扩大,软件系统的规模越来越大,复杂性越来越高。在这种背景下,发生了软件复杂性危机,即维护、故障排除等人的干预赶不上软
随着计算机技术的迅速发展,软件的应用范围越来越广泛,软件系统规模越来越大、结构越来越复杂。为了保证软件产品的质量,软件测试特别是自动化测试越来越受到人们的重视。软
为支持从各种移动对象产生的大量GPS数据,后端服务器通常存储低采样率的轨迹。因此,人们不能直接从后端服务器获得精确的位置信息,换句话说,不确定性是这些时空数据的固有特性。