概率XML数据上关键字检索算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户：d_kong

【摘要】

：

网络的发展日新月异,很多普通的用户都可以通过网络来查找所有它们感兴趣的信息。关键字检索这种方式正是普通用户用来查找它们感兴趣信息的主要方式,因为关键字检索并不需要

【作者】

：

赵越

【机构】

：

东北大学

【出处】

：

东北大学

【发表日期】

：

2009年期

【关键词】

：

概率XML数据关键字检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

网络的发展日新月异,很多普通的用户都可以通过网络来查找所有它们感兴趣的信息。关键字检索这种方式正是普通用户用来查找它们感兴趣信息的主要方式,因为关键字检索并不需要用户学习任何复杂的查询语言,也不需要了解底层数据的结构。随着不确定数据的出现,如何管理这些不确定数据已经越来越多的得到研究者的重视。本文采用一种概率XML数据模型——p document,该模型是表示不确定数据的一种方式。研究者可以通过在该模型上进行数据查询的方式来实现对不确定数据的管理。现有的关键字检索方法都是针对普通XML数据来进性研究的,为了实现概率XML数据的关键字检索,本文将概率XML数据处理方法以及SLCA关键字检索算法相结合,提出了基于SLCA的概率XML数据关键字检索算法和改进的基于SLCA的关键字检索算法。基于SLCA的概率XML数据关键字检索算法通过遍历概率XML数据,根据概率XML数据中概率分布节点来生成普通XML数据。在普通XML数据上执行关键字检索算法。当XML数据集很大时,处理XML数据将变成一个十分繁琐的问题。因此本文在该算法的基础上提出了改进的基于SLCA的概率XML数据关键字检索算法。算法通过阈值的设定和概率值的计算,将会减少所生成的XML数据量。由于减少了大量的检索数据,在进行关键字检索时会缩短检索时间,实现算法的优化。

其他文献

本溪电校教学管理系统的设计与实现

现代经济高速运转的需求带动了信息技术的迅猛发展,而信息化管理成为了企事业单位生存和发展所采用的普遍对策,建设教学管理信息系统是现代学校信息化管理的重要基础和核心内

学位

教学管理B/S数据库设计ASP

基于多核的数据并行编程平台的研究与实现

随着多核处理器的不断发展,应用程序对计算机性能提出了更高的要求,然而由于多核处理器每个核心的处理能力通常都比以往的单核处理器弱,使用多核处理器并不能直接带来高性能,

学位

多核处理器图像处理数据并行编程平台并行程序

关系数据分类算法的研究

传统数据挖掘的对象是单一关系表中的数据。对于许多实际应用,数据是存储在多个关系表中,先要把多关系数据集成到一个单一关系中,这需要大量的预处理工作,并且会导致信息丢失

学位

数据挖掘分类关系分类朴素贝叶斯神经网络

基于执行日志的Web服务QoS获取方法

目前,(?)Veb Services技术正受到产业界和学术界越来越多的关注,其应用也越来越广泛,出现了不少功能相同或相似的Web服务。在功能驱动的Web服务组合中,代表非功能属性的QoS与

学位

Web服务QoSQoS模型日志内容QoS时间点数据Web服务QoS的预测

基于SVG与web2.0技术的网络拓扑管理系统设计与实现

随着当今网络通信技术的高速发展,网络规模不断的扩大,复杂度不断的增加,如何可视化的管理如此庞大、复杂的网络,成为网络管理系统面临的一项重大任务。可视化的管理可以分为

学位

网络管理拓扑图web2.0可升级矢量图形Push

DAS模型中支持准确查询的数据加密与密文索引技术

对密文关系的查询处理是DAS模型面临的主要问题之一。目前,现有加密方案和索引方法均存在查询命中率低的缺陷,造成了不必要的网络堵塞。减少查询结果中冗余数据的数量是解决

学位

DAS模型加密数据库密文索引准确查询字符数据数值数据

六子棋中基于BP-TD学习的局面估值方法研究

空间搜索能力与局面估值的准确性是决定棋类游戏水平高低的最重要的两个方面。六子棋游戏规则简单,但状态空间复杂度高,平均分枝因子大。该特点限制了六子棋程序中博弈树搜索

学位

六子棋评估函数TD学习BP神经元网络两阶段着法选择策略

概率XML数据上关键字检索算法的研究与实现

其他学术论文