论文部分内容阅读
在数据中心建设过程中,ETL过程是一个复杂而又艰苦的工作,虽然目前有很多厂商提供不同的ETL工具,但要保证ETL前后数据的一致性,则还需要多种技术手段来共同实现。广西电网在配合南网数据中心建设过程中,7()%以上的时间用于数据的ETL。对于庞大数据的采集,现有的ETL工具会消耗大量的资源和时间,功能虽多,但是合乎需要的很少,软件体积庞大,部署困难。必须结合实际需求开发自动化采集工具,减少资源和时间消耗,减少人力投入,实现数据快捷、高效、准确地抽取、清洗、转换和加载,提高采集效率。虽然其中的很多技术细节还在