论文部分内容阅读
RFID(Radio Frequency Identification)无线射频识别,是一种非接触式的自动识别和数据获取技术。目前,已经广泛应用于智能大厦、供应链管理、门禁安全、防盗检测等领域。在RFID系统中会产生海量的原始事件,这些原始事件由于存在多读、漏读及重复读等问题,不能被应用程序直接使用。虽然目前对RFID原始事件的清洗方法很多,但没有任何一种方法能达到100%的清洗效果,因此,导致在这些清洗不彻底的事件流上生成的复合事件具有非确定性。对复合事件进行清洗是一个难点问题,经过研究发现如果没有其它参照信息,仅通过以往的RFID数据清洗方法很难得到正确的结果。为了找到这种支持复合事件清洗的参照信息,本文对RFID许多应用领域进行研究,发现在这些应用中会产生大量具有时序关系的标签数据,这些数据对于发现标签在系统内的频繁路径模式是极其重要的。本文结合数据挖掘领域的思想,把如何高效的从海量的具有时序关系的RFID标签数据中挖掘频繁路径事件模式作为本文的研究重点,本文的主要工作如下。(1)在滑动时间窗口内实现RFID路径事件的获取。包括①路径识别。以每个标签的EPC作为键值,通过相同EPC的标签读数的时间戳的时间相关性来整理出各个物体的移动轨迹(即一个路径事件),从而把杂乱的RFID路径段信息整理成适于挖掘的形式。②路径压缩。把RFID路径信息进行地点、时间维度上的压缩,从而大大节省了存储空间。(2)提出了一种频繁概率路径事件模型。该模型是RFID应用中具有时序关系的频繁路径事件模式的抽象表示,本文采用滑动窗口技术动态更新频繁路径事件模型,模型不但可以准确预测后续到达的路径事件,而且能够支持具有时序关系的复合事件的清洗。(3)提出了一种在滑动窗口内挖掘RFID频繁闭路径模式的方法SW-MFCP(Sliding Window-Mining Frequent Closed Pattens)。该方法通过动态构建路径挖掘树PM-tree(Path Mining Tree),利用时间衰减函数对挖掘树中各模式的支持数进行统计,以此来描述滑动窗口内模式的频繁程度。(4)为了描述物体在各个路径分支上移动的可能性,本文针对频繁路径事件模式上的每个阅读器结点,计算出跃迁概率和发散概率,以此来引入时间约束,并给出以某个结点为终止的路径事件的发生率。(5)本文通过实验验证了挖掘出的含有概率信息的频繁路径事件模式的有效性,并验证了SW-MFCP算法的空间和时间的高效性。