论文部分内容阅读
随着无线内容下载技术的出现和成熟,在下载平台中逐渐出现了许多对大量事件进行实时处理的应用需求。事件流处理需要应对庞大的数据集和高度的流动性,由此产生了许多新的基础性研究问题。本文在对无线内容下载平台中对事件流处理需求进行分析的基础上,提出了一种全新的事件流处理模型,并对其中的关键算法和实现进行了研究。本文将基于数据流的处理模型和基于时态逻辑的处理模型进行了结合,在对事件、事件流和事件模式进行形式化定义基础上,定义了事件流处理语言,其语义继承了持续查询语言的优点,既可以利用现有关系语言的形式化基础和实现技术,处理语句又非常简单易用。其中两种处理模型的结合主要是针对事件流的模型匹配需求,本文给出一种正则语言来表达所要进行匹配的事件模式。并通过给出构造与该语言等价的有穷自动机的算法,采用有穷自动机的方法对事件流处理中的模式匹配问题进行求解。并且将目前的研究工作中只能按照给定的输入元素进行既定的模式匹配扩展到了能够支持自定义事件模式。本文另外一个创新点在于对使用增量数据模型进行事件流处理优化的做了深入研究。在事件流处理中的性能优化方面,目前国内外的研究工作中还没有关于增量数据模型的讨论,所以本文研究中没有办法进行比较和分析,主要是探索性的研究工作。工作包括使用增量数据模型对事件流处理进行建模,利用递归划分和求解最优评估树的方法来实现优化事件流处理、降低成本,并且对算法进行了复杂度分析。由于在多输入事件流多处理语句的事件流处理问题的求解复杂度是NP难的,本文给出了在多输入事件流多处理语句的事件流处理中的贪婪算法。在应用创新方面,本文给出了事件流处理引擎的原型实现,包括事件流处理的整体架构、内部各组件之间的关系、事件流处理引擎的事件内部表示、处理模型及执行计划等。并在研究已有SQL/XML标准的基础上,将XML这种半结构化的事件表达方式扩展到事件流处理语言。在描述无线内容下载平台系统组成的基础上,详细的阐述了平台中的事件流处理实现。实验通过对大量事件流的成功处理,验证了第一点创新流处理模型的有效性;而实验中的平均响应时间、分位数响应时间和吞吐量充分说明了增量数据模型这种优化算法的高效性、鲁棒性和适应性。综述,本文的研究工作具有很好的社会推广价值。