论文部分内容阅读
RFID (Radio Frequency Identification)射频识别技术,是一种快速的、非接触式的识别技术,基于低成本、易使用、技术成熟等特点,RFID技术已经被广泛应用到各个领域中。RFID企业应用多样而复杂,底层获取的数据量大而乱,需要一个平台来进行数据管理以及数据操作,RFID中间件正是应这种需求而产生的,RFID中间件是RFID系统的重要组成部分,在RFID标签数据代表的物理世界与各种应用系统之间建立桥梁,为RFID应用商提供基于中间件的平台是目前的发展趋势,由此引入了RFID中间件技术。基于RFID技术的应用系统会实时产生大量RFID数据,这些原始数据经由RFID阅读器并传送到RFID中间件,一方面RFID中间件要对大量数据进行存储访问;另一方面还要对这些夹杂错误原始数据进行处理得到准确数据,这两方面都是RFID中间件系统的关键技术,也是目前亟待解决的问题。为了实现高性能的RFID中间件系统,本文主要对海量标签记录的高效存储和快速访问进行研究,现有的海量数据管理技术都是基于B-树或B+树的磁盘索引技术,磁盘索引对于高实时性大吞吐量的RFID中间件来说不能满足其高速存取需求,所以本文采用内存当做数据存储和索引的介质,在深入标签组成、结构特点以及应用情况后设计了一种Suffix_T内存索引结构,它将标签记录进行分割存储,首先利用标签公共前缀的特点,使RFID海量标签记录的占用空间大大压缩,然后再利用T-树结构存储记录的后缀。这种索引结构无论在更新速度、查询速度还是在空间占用率上都较传统索引结构AVL树、B-树、T树等有较好的提升,最后通过实验证明了的结论。另一方面,由阅读器获取并存入到数据存储模块中的数据是原始的RFID流数据,也是夹杂着各种错误的流数据,在进一步应用前,RFID中间件系统要将这些流数据进行处理。本文分析了流数据的各种错误及造成的原因,对其中造成数据不可靠性最大的消极读取错误进行了深入研究,在详细分析了自适应清洗算法的不完善之处后提出了一个改进算法ISMURF,并通过实验验证了在阅读器的读取率很稳定时改进算法的准确率达到90%以上,而且改进算法性能比原算法有15%的提高。