面向Markov链的新型复合事件检测技术研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:ITlogileon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着RFID和传感器网络技术的快速发展,针对RFID数据的复合事件探测技术得到了日益广泛的应用,如事件预警与事件监控。已有工作一般都是针对确定性数据流,对大量原子事件进行精确匹配,查找复合事件。而在真实情况中,由于阅读器漏读等原因,会造成事件具有不确定性和关联性,而且往往需要对原子事件进行相似性检测。同时,敏感数据的隐私保护也十分重要。因此,本文主要针对符合Markov相关性的数据,从精确匹配、相似性检测和隐私保护三方面进行复合事件检测技术的相关研究。首先,针对符合Markov特性的不确定事件序列,本文形式化定义了匹配事件集和不确定复合事件查询,并针对不确定复合事件精确查询问题,提出了基于序列优先的查询处理方法(seqF_Q)和基于相关性优先的查询处理方法(corF_Q)。两种算法可在多项式时间内对该问题进行求解。考虑到两种算法的影响因素,本文使用真实数据集和虚拟数据集进行测评分析。实验表明,corF_Q方法的处理效率高于seqF_Q方法。其次,针对Markov不确定事件序列的相似性查询问题,本文对上面提出的问题进行扩展,形式化定义了复合事件相似性距离和不确定性复合事件相似性查询问题。为提高检测效率,本文构建了MCE_Index索引并将其分别与seqF_Q和corF_Q方法结合,提出序列优先的相似性查询处理方法(seqF_SQ)和相关性优先的查询处理方法(corF_SQ)。进一步,本文通过设计缓存机制改进了corF_SQ方法,即corF_ca_SQ方法。在真实数据集和虚拟数据集上的实验验证了三种算法的可行性。其中,corF_ca_SQ处理效率最高。最后,针对Markov事件序列的复合事件隐私保护问题,本文对隐私保护的相关概念进行定义,提出了适用于Markov事件序列的效用增益函数,然后提出了基于事件类型(Type_S)和基于事件实例(Instance_S)的舍弃策略,并基于corF_Q方法实现两种策咯。效用增益和处理时间的实验结果表明,Type_S方法具有较高的处理效率,而Instance_S方法能够获得较高效用增益值。因此可以根据特定应用场景选择合适的方法进行相关处理。总之,本文主要研究了数据的不确定性和相关性,并针对面向Markov事件序列的复合事件技术中的关键问题,即精确性匹配、相似性匹配和隐私保护三个方面,提出了高效的解决方案。大量的实验验证了本文方案的高效性和准确性。
其他文献
公路规范查询与公式计算系统,主要针对当前的公路设计人员在设计过程中的需求而设计。公路设计人员在设计公路等过程中经常需要从大量规范标准中查阅技术标准、设计和施工规
Internet的迅猛发展、经济全球化时代的到来以及电子商务的广泛开展促成了机器翻译热潮。通常,用户通过购买相关软件或访问提供在线翻译的网站来获取翻译服务,然而,用户或者需要
非线性理论由三大理论构成:混沌理论、分形理论、孤立子理论。对非线性理论的研究常常以理论研究为主,本文在非线性理论研究的基础上探讨了分形自然景观模拟的应用。 分形
双语训练语料作为统计机器翻译系统的不可或缺的知识来源,直接影响系统的翻译性能。一般情况下,训练语料的增加可以使系统翻译性能上升。但是随着语料规模的增加,系统的训练
混沌现象普遍存在,它揭示了非线性科学的共同属性:有序性和无序性的统一,确定性和随机性的统一。近年来,随着对混沌理论研究的不断深入,混沌理论的应用已成为目前国内外关注的学术
  本文所采用的这样方法的最大特点是积累和利用系统使用者的经验和智慧,最大优势是通过对使用者检索行为的积累达到了系统能力自动积累和提高、自我修正的能力。  本文采
本文主要介绍基于语义的图形检索,它可以充分利用图形的导出信息,如语义,和用户的个性化信息,建立视觉内容和图形语义之间的关联.基于语义的图形检索的优点主要是突破了机械
本文采用Linux操作系统作为应用软件开发平台作为可穿戴计算机的开发环境。本文结合哈尔滨工业大学可穿戴计算机研究工程中心的项目分析了各军兵种的实际需要,总结了其中
产品结构和产品配置(Product Structure and Configuration Management)是产品数据组织与管理的一种形式。产品结构是描述组成一个产品的零件、零件集、部件、部件集及它们之
在传统的文本检索中,用户只要输入感兴趣的词语,系统就会返回含有查询词的文档的完整信息。而在关系数据库管理系统中,回答某个查询的信息为了规范化存储,通常会分别存储在关