基于不确定有限自动机的XML文档发布/订阅系统的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:cugll2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术及其应用的快速发展,XML已经成为万维网上信息表示和数据交换的一个重要标准,XML在电子商务、电子数据交换、科学数据表示、数据建模与分析和搜索引擎等领域有着广泛的应用。发布/订阅系统具有异步性、多点通信的特点,使信息的发布者和订阅者在空间、时间和控制流这三个方面都被完全的解耦,能够很好地满足大规模的、高度动态的、基于Internet的分布式计算机环境的新需要。到目前为止,在Web上已经积累了大量的XML文档数据并且快速地更新,XML文档发布/订阅系统可以根据不同的用户需求,即时的将XML文档发送给对其感兴趣的用户。尽管Y-Filter的查询前缀共享思想有效地提高了查询处理的效率,却没有考虑不确定有限自动机查询路径结构匹配的过程栈中的状态节点数量随栈的深度有着指数级的增长,因此,本文对路径结构匹配过程中栈的状态优化问题进行深入研究。本文根据XML文档和查询的特点设计了基于深度优先的堆栈优化算法,并利用回溯和跳转操作减少了不必要的元素匹配操作。为了分析基于深度优先的堆栈优化算法的性能,本文设计了相应的实验,并针对于不同的参数变化分析了系统的性能。实验结果表明,本文提出的基于深度优先的堆栈优化算法有效的减少了查询结构匹配过程栈中状态节点的数量,·并且在响应时间上是可以接受的。此外,由于XML查询匹配的结构匹配阶段和谓词匹配阶段在时间上的不相关性,本文将流水技术用于XML文档发布/订阅系统中,并根据单路径查询和Twig查询结构上的区别,将使用包含不同流水段的流水线对其进行处理。流水技术的使用提高了XML文档发布/订阅系统的处理效率。本文为单路径查询和Twig查询分别进行了相关的实验,实验结果表明,基于流水技术的单路径查询和Twig查询的匹配算法分别节省了25%和50%的时间。
其他文献
在信息时代背景下,语音是人们日常生活中最直接的信息传递与交换形式。而现实生活中,多数语音往往伴随着噪声,使人感到舒适度下降。听力受损的人理解不同背景噪声下的语音是
内容管理是当前信息化建设领域的热点。越来越多的机构、企业开始关注研究内容管理,研制开发内容管理系统。有关专家断言,在接下来的信息化建设中,内容管理将是关键所在。本
传统农业大多劳动强度大,对劳动经验有较强的依赖性,智能农业机械导航系统将是解决此问题的有效方法之一。基于双目视觉的导航系统因价格低廉,信息丰富等优点受到越来越多的
在工业生产环境中,将无线技术应用于工业测控系统,带来传统测控系统无法比拟的优势。由于工业无线网络中信道环境复杂和无线节点资源受限等因素,现有无线网络的路由机制已经
现代安全系统中,加密算法通常需要在不同的复杂环境中执行,而应用环境中用户的密钥一旦泄露往往直接导致传统安全方案的完全失效,事实上此类密钥泄露在真实环境下是难以杜绝
RFID与企业业务流程进行集成已成为RFID领域的一个重要的研究方向。而现有的RFID业务流程集成方案大都基于传统的业务流程引擎,并不能很好地满足RFID业务流程的需求。并且现
Ad Hoc网络是一种不依赖于固定基础设施的移动网络,在这个网络模式中,移动节点既是主机也是路由器,它是完全自组织、自适应的由无线节点组成的新型网络。无论是在军事、抢险,还是
在E-learning教学环境中,多媒体课件是使用最为广泛的教学内容载体。而针对多媒体课件的检索服务可以使学生方便地选择他们所感兴趣的部分从而提高了教学效率。基于语音的内
随着云计算技术的发展,云存储服务逐渐成为商业应用及个人应用普遍采用的存储解决方案。用户向云存储服务端发出文件下载请求,云端服务器收到请求后开始提供内容分发服务,内
随着RFID应用规模的不断扩大,读写器网络以及网络中的RFID数据流变得越来越复杂,这对RFID中间件提出了新的要求。在RFID网络化应用中,中间件需要全面地获知读写器网络以及网