论文部分内容阅读
随着信息化技术的快速发展,Internet已逐渐成为了人们生活、学习和工作的重要部分。伴随着企业的成长,各部门积累的常用数据信息也将随之越来越多,但由于过去遗留的大多数系统在设计时未充分考虑各系统间数据的共享和交换,各系统彼此独立,数据表设计不尽相同,数据的不一致导致一个个“信息孤岛”形成。今天,面对日益激烈的竞争,企业信息和数据的集成交换需求越来越频繁,因此这些系统已经无法满足现在的需要。因而,企业强烈希望构建数据仓库,以达到数据信息的共享和提供决策支持。ETL(Extract,Transformation,Loading,抽取、转换、加载)工具正是数据集成建立数据仓库的可选方案之一。本文基于B/S结构,对ETL系统的架构、技术和在ETL过程中相当重要的数据抽取、数据转换和数据加载以及数据清洗等相关问题进行了详细分析和设计。然后使用JAVA语言、JavaScript、ExtJS、JDBC数据访问接口和XML技术,并结合RBAC思想设计了跨平台运行、支持增量同步更新、具有友好操作界面、可与其他web服务无缝集成的Comsys ETL系统模型和实现方案。