论文部分内容阅读
近年来,随着RFID技术的逐渐成熟,RFID(射频识别)以其简单、快捷等特点越来越多的受到人们的关注,广泛的应用在智能大厦、供应链、财产追踪、制药监管等领域中,然而RFID原始数据的非确定性制约了RFID技术的进一步发展,为了提供高质量的RFID数据,对RFID原始数据进行清洗是十分必要的。RFID的非确定性数据主要包括:漏读、错读和冗余读。本文对RFID的3种非确定性数据进行了深入研究,针对不同应用环境下的RFID提出了两种RFID数据流清洗方法,具体工作如下:针对不存在复杂关系的应用环境中的RFID数据流,提出了一种基于自适应滑动窗口的清洗方法-VSBFC,并给出了清洗方法的结构。该结构分为3层:窗口调整层、冗余读处理层、漏读和错读处理层。在窗口调整层,针对RFID流速的非匀速性,提出了一种基于数据流速的自适应滑动窗口清洗方法。在窗口大小调整过程中,同时考虑数据的流速和窗口中数据的平均阅读率。在冗余读处理层,提出了一种基于伪事件的清洗方法,有效地去除数据流中的冗余读数据。在漏读和错读处理层,提出了一种对漏读和错读的一次性处理方法,缩减了清洗方法的中间数据。针对存在复杂关系的应用环境中的RFID数据流,提出了一种基于复杂关系的数据清洗方法-CRRC,并给出了清洗方法的结构。该结构分为4层:动态图构建层、非确定性推理层、图修剪层以及复合数据层。在动态图构建层,给出了编码标签复杂关系的动态图的构建方法,并给出了图的更新算法。在非确定性推理层,提出了一种基于包含关系和邻接关系的错读处理方法。在图修剪层,提出了一种基于图连通分量的错读处理方法。在复合数据层,介绍了6种复合数据,并给出了复合数据的生成方法。实验结果表明本文提出的两种清洗方法在各自的应用领域中具有良好的表现。