论文部分内容阅读
随着工业互联网技术不断发展,大数据和语义Web在工业设备能耗数据分析方面已被广泛应用。但工业设备数据处理还存在诸多问题:缺乏多功能数据分析平台、数据和信息管理复杂度高、信息共享性低、数据分析智能化程度不高等。同时,工业互联网产业联盟提出了“数据-信息-知识-决策”智能闭环数据分析需求。针对上述问题,本文融合大数据和语义Web进行工业设备能耗数据分析,实现了“数据-信息-知识-决策”的智能闭环系统。该系统基于数据分析平台,将能耗数据信息化结果无缝对接语义Web信息知识化模块,实现设备能耗数据信息化与信息知识化。该系统提供丰富的数据处理方法,解决了设备能耗信息共享性低和管理复杂度高等问题。在能耗相关数据处理中,部分大数据引擎的实时性和稳定性不能完全满足实际生产要求,所以本文对部分大数据引擎进行了优化。本文主要研究与创新内容如下:针对工业互联网产业联盟提出“数据-信息-知识-决策”智能闭环数据分析需求,本文设计了工业设备能耗数据智能闭环系统架构:大数据信息化模块实现工业设备能耗数据信息化功能;语义Web信息知识化模块实现工业设备能耗信息知识化功能。该系统将两个模块对接,实现“数据-信息-知识-决策”智能闭环系统。针对工业互联网产业联盟指出缺乏多功能数据分析平台的问题,本文搭建了支持多种数据分析方法的数据分析平台。数据分析平台提供的数据分析方法:抽取、转换、传输、存储、查询、能耗报表、离线分析、实时分析、在线可视化分析、机器学习、深度学习、领域本体建模、知识表示、知识推理等。针对工业设备能耗信息管理复杂度高、信息共享性低等问题,数据信息化模块分析解决数据结构异构问题,信息知识化模块实现信息融合与设备能耗信息互操作。针对部分大数据引擎处理数据实时性和稳定性不高的问题,本文优化了计算引擎的压缩和序列化算法。压缩算法采用LZ4、LZO,序列化算法采用Protobuf、Protostuff,并重构部分大数据引擎。同时,本文实现了HDFS、HBase等引擎的高可用和联邦机制,基于Elastic Search(ES)建立了HBase二级索引,使用状态机制避免了流式数据重复消费。基于Django、ECharts等框架,开发了工业设备能耗数据智能闭环应用系统的测试模块。系统测试结果表明:数据分析平台实现了多种数据分析方法,满足了工业设备能耗数据多种数据分析需求;工业设备能耗信息知识化模块具备信息知识表示和推理功能;优化后的大数据引擎压缩和序列化算法相比原集成的算法性能具有显著提高。因此,本文提出的工业设备能耗数据智能闭环数据分析方案合理,开发的应用满足工业设备能耗数据智能闭环数据分析需求,进而提高了工业设备能耗管理智能化程度。