论文部分内容阅读
目前,物联网中所采集的数据类型多种多样,不仅包括RFID读写器实时采集到的各类RFID信息,而且包括分布于各地的传感器实时采集的与物品相关的各类感知数据。此外,物联网采集的数据并不是一次采集完成,而是一组不断增加的、实时更新的数据信息。这种具有实时性、连续性、有序性特点的数据称之为数据流。 针对物联网前端感知信息的海量性和异构性问题,目前已有的相关研究并不适用。物联网中,传统的应用于不同平台的数据集成技术XML(eXtensible Markup Language)已被PML(Physical Markup Language)技术所取代,也就是说PML更加适用于物联网中的不同类型信息传输。其次,当前XML聚类技术一般针对少量的静态数据信息,而对于海量的、实时的、异构的物联网数据流聚类则束手无策。此外,XML文档与PML文档存在一些不同之处,这些XML聚类技术并不能很好的适用于PML文档聚类。 因此,本文提出了一种基于PML的物联网异构信息聚合技术。首先,本文重点介绍了一种物联网异构信息聚合模型,并对感知层、传输层、处理层和应用层的功能和作用做出详细的说明。其次,本文针对PML文档的特点,在处理层中设计了一种基于贝叶斯网络的PML文档相似度计算方法,并给出具体算法描述。此外,在此PML文档相似度计算的基础上,本文给出基于动态滑动窗口的PML数据流聚类方案,能够将海量的、异构的PML文档数据流进行聚类。最后,实验结果表明基于贝叶斯网络模型的PML文档相似度计算方法具有较高的查准率和查重率,并且基于动态滑动窗口的PML数据流聚类方法具有较高的聚类质量。