基于XML文档流的信息推送系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:l541306072
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet和无线互联网的蓬勃发展,信息推送系统(SDI)正越来越成为人们方便、即时地获取信息的强有力工具.典型的,它是将数据流信息发送到无线用户的必由桥梁.在Internet环境下,由于用户信息订购的巨量性以及Internet本身的开放性、动态性,需要在新近数据与用户查询之间做出快速匹配,因此SDI系统的可扩展性成为考虑其是否可用的一个关键技术因素.该论文主要研究实现基于XML文档流的SDI系统可扩展性的关键技术,包括查询索引、查询聚类、查询包含、复杂查询处理等,在考察当前最前沿的研究成果的基础上作进一步深入的探索和研究,并最终建立起一个基于XML的、适合于海量用户访问数据流的信息服务模型.论文的主要贡献如下:首先,在通用的SDI系统体系结构基础上进行改进,提出了能够提供较好的系统扩展性的体系结构.通过将用户定购组织和管理模块独立出来,同时在该模块中引入查询的聚类分析阶段,可以更有效地进行查询聚集.其次,提出了一种有效的XPath查询相似性计算方法.该算法充分考虑了XML文档数据自身的特征和XPath树模式的特性,能够真正意义地找出相似的树模式进行聚类聚集处理,保证了比较理想的匹配精度和系统可扩展性权衡.第三,该文提出了一种效率较高的两级查询索引机制,在结构索引的基础上引入了基于值的谓词索引.与已有的NFA查询索引不一样:我们不将嵌套路径作为谓词索引的一部分,而是把它完全结合到了基于NFA的结构索引中.同时论文针对基于值的选择谓词构造了各种不同的索引结构,包括等值Hash结构,二叉平衡树等,能够提供更加快速的查询匹配.最后,论文提出了处理复杂查询布尔树结构(逻辑树),使得系统能够很好的处理复杂的XML查询,同时提供了逻辑树计算的有效算法,提高匹配效率.
其他文献
随着网络应用日益广泛,网络安全已成为现今人们关心和研究的热点问题.设计安全措施来防范未经授权访问系统的资源和数据,是当前网络安全领域的一个十分重要而迫切的问题.目前
随着因特网、Web技术的快速发展,用户对服务可用性和服务质量的要求越来越高.如何提高基于Web的分布式文件存储系统的可用性是我们面临的一个新问题.在分布式文件存储系统中,
Map/Reduce型海量数据处理平台(以下简称“Map/Reduce平台”)是海量数据处理领域的最新技术进展。Map/Reduce平台具有简化的并行编程模型、以数据本地化处理为导向的计算模式以
Internet上大量的文档资源具有隐藏性,无法通过链接结构直接抓取,对它们的发现和利用是通过搜索引擎提供的界面来实现的.随着互联网的迅猛发展,如何能对互联网上的这些隐藏的
从20世纪90年代初至今,以手机、PDA和掌上电脑为代表的手持移动设备得到了日益广泛的应用,手持移动计算已经逐渐成为当今的主流计算模式之一.随着移动设备自身软硬件性能的提
通信性能是影响集群系统实际并行处理效率的关键.随着网络技术的发展,网络硬件的通信能力迅速提高,而软件协议发燕尾服则相对滞后,导致协议开销逐渐成为通信的瓶颈.针对这种
针对企业用户的具体需求,就目前工业现场过程控制的现状及其未来发展趋势,提出了一个行之有效的小型集散控制系统(Distributed Control System)的设计研发方案.为此,本文以集
在Internet之上提供Video on demand(VoD)服务是一个很有挑战性的问题.困难存在于两个方面.首先由于视频流的高带宽需求和比较长的传输时限对于端到端的网络传播来说是一个考
在过去的几年时间里,对等网络(Peer-to-Peer Network,简称P2P)迅速成为计算机界关注的热门话题这一.P2P是网络计算一种新技术,这种技术的目的就是将网络中不同的计算机连接在
近年来的WEB服务和网格技术的发展,极大的促进了各种分布式系统的发展.分布式环境中的移动计算正迅速在现实中被广泛应用.移动代码就是指那些可以在除了代码来自的主机以外的