含逻辑谓词的模糊XML复杂小枝查询方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:wc4854598
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于具有良好的灵活性和可扩展性,XML已经成为了Web上信息交换和表示的主流格式和事实的标准,并且在很多领域都得到广泛和深入的应用。而现实世界中存在的数据往往是不精确的和不确定的,同时由于现实世界存在主观性,某些数据在本质上就是具有模糊性的,例如对某一事物的主观的评价。如何在XML中表示这些模糊信息以及如何对大量的模糊XML文档进行有效地管理,已经成为一个重要的研究课题。作为XML的主流结构化查询语言,XQuery查询处理的核心操作处理对象是Twig(小枝)查询—通常人们用Twig查询表示查询感兴趣的节点以及它们之间的结构关系,Twig查询处理的优劣在很大程度上决定了整个XML查询的处理效率,同时,用户的查询意图中往往包含各种逻辑,例如,必须同时满足多个查询条件(AND逻辑)、多个查询条件中满足其中的一个即可(OR逻辑)或者绝对不能包含某个条件(NOT逻辑)。目前,对模糊XML环境下含谓词的小枝查询的研究成果还较少,另一方面,已有的查询算法在I/O操作性能方面还不是很理想。针对上述情况,本文对含逻辑谓词的模糊XML复杂小枝查询方法做了深入的研究。由于现有的编码方案并不支持对模糊XML中模糊信息的表示,因此,首先对现有的扩展的Dewey编码进行模糊扩展,使得从一个节点的编码能够同时获取该节点在模糊XML文档中的结构信息和隶属度信息,为查询方法的提出奠定了编码的基础。然后,针对已有的处理含逻辑谓词的模糊XML复杂小枝查询算法较高的I/O操作代价,提出了以路径为匹配单位的整体匹配算法FATJFast算法、FA/OTJFast算法和FNTJFast算法,分别处理AND逻辑的模糊XML小枝查询、AND/OR逻辑的模糊XML小枝查询和NOT逻辑的模糊XML小枝查询,在匹配的过程中仅仅需要访问查询叶子节点,降低了I/O代价,并且以路径为匹配单位,避免了分解粒度过细所带来的大量的时间消耗。最后,通过实验对所提出的算法进行验证,实验证明,在同一查询条件下,本文所提出的整体匹配算法与已有的查询算法相比,访问节点数明显减少,整体的执行效率有显著地提高。
其他文献
随着电子通信和计算技术的迅猛发展,网络化嵌入式系统特别是CPS(物理信息系统)已成为国内外研究的重要领域,而节点操作系统是CPS研究的关键方向。其中,文件系统作为节点操作
在过去的十几年时间内,因特网得到了爆炸式的增长。虽然网络带宽容量也有了飞速的增长,但由于用户数量的增加和各种新型应用的出现,使Internet的流量急剧增长,网络负载反而比
微博客(即微博,Microblog)作为一种新兴的Web2.0应用,已经成为信息分享和传播的重要工具和平台,微博用户通过固定和移动设备,能够方便地发布、转发、与其他用户共享信息。由
本文针对分布式多数据库节点间的数据传输,设计了一种基于点对点的通信协议DACP(DuplexandAsynchronousCommunicationProtocol),该协议包含两部分:一部分是异步串行通信,基于PSTN
本文提出一种图像纹理特征提取的新途径——人工生命。文章研究出一种名为“人工爬虫”的人工生命群体,通过这些爬虫在纹理图像所对应的生存空间中生长进化所形成的特征曲线,实
采购管理是供应链管理中的重要一环,是实施供应链管理的基础,正在逐渐受到国内外学者的广泛重视。采购的成本直接影响到企业的利润和资产回报率,影响企业流动资金的回笼速度。采
组件对象技术COM是Microsoft提出的一种基础的软件重用技术。“储层地质统计分析系统GASOR”是一个应用于油气储层随机建模的工作站版本的商品化软件系统。随着计算机技术的
我国加入WTO使中小企业有了更加广阔的发展前景,但竞争也日趋激烈。中小企业一方面要在激烈的竞争中站稳脚跟,另一方面还要寻找机会发展壮大自己。在这样的背景下,中小企业信
随着中国石油勘探与生产公司企业信息门户的建立,需要将勘探与生产的应用系统集成到信息门户中,并实现用户身份的统一认证。本论文就如何实现中国石油勘探与生产公司企业信息门
随着计算机和通信技术的发展,互联网已经成为人们发布和获取信息的重要渠道。然而,由于互联网信息发布的无地域性和匿名性等特点,各种信息难以进行有效的监督和管理。互联网信息