论文部分内容阅读
现今世界范围内的商业环境和竞争节奏发生急剧变化,从客观上提高了企业对商业智能和数据仓库的依赖和需求。数据仓库查询技术是商业智能的重要组成部分,传统上,数据仓库的信息消费者主要通过浏览定制后的报表的方式使用数据仓库,但对于非技术人员,传统的查询技术一般难以掌握或者存在某些易用性上的不足。究其原因,是由于数据仓库系统缺乏高效的人机交互方式。
本文提出采用数据仓库中文查询结合传统OLAP查询的方式,可大大改善人机交互的效果。中文查询提供了用户直接以人类语言(而不是人工语言或机器语言)的方式向数据仓库系统发问以获得所需的信息,从而大大改善了人机交互的容易程度。但由于技术上的不成熟,中文查询并不能保证其绝对的正确性,其查询结果可能只能是接近用户的查询原意。OLAP查询可在中文查询的基础上,通过基本的OLAP操作,达到用户查询的原意。
本文总结了OLAP可视化和数据仓库标准查询接口,研究了数据仓库中文查询的关键技术,开发出数据仓库中文查询系统IChilqDW,IChilqDW通过词汇知识提取和词汇知识学习获取有关具体的数据仓库领域内的中文查询语句语义,将中文查询语句转换为OLAP标准查询语言MDX,然后执行MDX,获得用户查询的OLAP结果。
在中文查询语句转换为MDX语句的算法中,IChilqDW中提供了基于语义依存和基于中心词最近匹配原则两种算法,均达到了较好的准确率和运算效率。
文章提出以中文查询技术结合传统的OLAP技术,以改善数据仓库查询的人机交互效果,具有一定的创新性。由于现今国内外几乎不存在对数据仓库自然语言查询的研究,数据仓库中文查询系统IChilqDW的提出和实现对于数据仓库查询技术具有一定的开创性意义。
IChilqDW提供的基于语义依存和基于中心词最近匹配原则两种转换算法,是对自然语言处理理论和中文信息处理理论的具体应用,对于该领域有借鉴作用。IChilqDW的目标在于使人们可以更容易、更方便地使用计算机和数据仓库,它的提出和实现具有一定的现实意义。