基于ETL的企业数据交换平台的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lsydyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展,现代信息企业的数字化建设成为发展的必然趋势。随着时间的推移,企业的发展壮大过程中各个部门都具有独立完善的业务系统。由于历史因素、人为因素和地理因素等,导致数据无法在系统之间流通,而形成“信息孤岛”式业务,这种业务方式已经严重影响企业的信息化建设。因此,项目组根据跨地域、跨网段的数据共享的需求,设计一个数据交换平台来解决上述问题。ETL(Extract-Transform-Load)是当前较流行的数据交换技术,论文以开源ETL工具Kettle为基础,企业数字化建设需求为背景,分析数据交换平台的发展状况和研究现状,对ETL工具二次开发。对Kettle进行改造,从技术的角度上改进了ETL工具上数据传输过程,优化了定时启动功能。并为之后管理人员使用提供平台的实时信息。Kettle的一大特点是纯Java编写的,因此,本文使用Java为基本的开发语言,数据交换平台总体设计上是由数据交换节点分布在不同地域组成的。数据交换过程分为本地数据交换和异地数据交换,在本地局域网内的数据交换过程利用Kettle内部提供的接口可直接实现对数据交换节点上的数据库表和文件进行多样化的导入导出。本文的主要工作如下:1)异地数据交换过程中,利用Kettle解决数据异构性的问题,摒弃了Kettle和FTP服务器或VPN链接结合的过程,采用对Kettle工具二次开发过程实现的套接字发送功能,可直接对Kettle的部署完成数据在异地传输。2)为保证数据的高效、安全、稳定传输,在进行套接字发送过程中增加嵌套文件扫描、路由同步等功能,并使用遗传算法解决数据传输过程中多目标路径选择的问题。3)数据进行异地传输过程中,主要采用文件的方式进行交换,文件在传输过程中可以记录数据交换过程的断点位置,为断点续传做准备,数据也可进行加密处理防止被窃取等操作。实际的测试过程中,本平台可以完成数据交换的基本功能,并实现本地、异地不同的定时数据交换机制,数据可以长期稳定的从起始节点经过中间节点路由传输到目的节点。该数据交换平台已经简单的部署,运行情况良好,满足管理人员的基本需求。
其他文献
国务院发展研究中心企业所副所长张文魁近日在北京表示,我国经济已经触底企稳,但难以持续快速地回暖,经济发展将呈现U型走势。
在近日开幕的第九届山东淄博陶博会上,日用瓷尤为抢人眼球,参展的日用瓷企业数量比2008年有所增加,而且展出的产品在层次上都有所提升,其中包括山东著名企业及唐山展区企业.参观的
当前,随着全球环境的恶化和地质灾害的不断发生,人口、资源、环境与经济可持续发展的相互关系研究,已为各国所重视,因为它是涉及人类未来的大问题。自80年代,特别是进入90年代以来
本文笔者详细分析了高层住宅地下室防水的意义及地下室渗漏水原因,并由防水混凝土的施工、防水卷材的施工及特殊部位防水工程的施工三个方面,深入探讨了高层住宅地下室防水工程
各类教材中(《必修.2》)都有这样一道类似的练习题(人教A版习题4.1B组第3题、人教B版第98页例3及苏教版第106页习题4.2(1)第10题):
新能源技术产业是现代社会能源发展的必然走向,发展清洁、安全的新能源技术产业,是环境友好型、资源节约型社会发展的本质要求,是推动和谐社会发展必不可少的原动力,是重要的战略
目的研究透明质酸联合抗菌肽敷料对于中重度痤疮患者的治疗效果及安全性,为临床医师治疗痤疮提供新的方法。方法选取2014年6月至2015年8就诊的中重度痤疮患者45例为研究对象,
群文阅读能够在比较短的时间内让学生阅读到几篇相同主题或相反主题的文章,通过阅读比较,学生可以养成很强的阅读能力。确定议题是群文阅读的重点,教师应以议题为线索组合选
本文介绍了一种用FRAM和MRAM实现瞬态信号的采集存储,实现了10us生存周期内信号存储,并搭建了试验验证环境,验证了该方案的可行性。
随着城市化进程的高速发展,道路系统的完善已成为一种趋势,并受到广泛的重视和关注。本文以具体的工程案例为例,分析城市快速道路沥青路面的施工。