概率XML数据上关键字检索算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:d_kong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的发展日新月异,很多普通的用户都可以通过网络来查找所有它们感兴趣的信息。关键字检索这种方式正是普通用户用来查找它们感兴趣信息的主要方式,因为关键字检索并不需要用户学习任何复杂的查询语言,也不需要了解底层数据的结构。随着不确定数据的出现,如何管理这些不确定数据已经越来越多的得到研究者的重视。本文采用一种概率XML数据模型——p document,该模型是表示不确定数据的一种方式。研究者可以通过在该模型上进行数据查询的方式来实现对不确定数据的管理。现有的关键字检索方法都是针对普通XML数据来进性研究的,为了实现概率XML数据的关键字检索,本文将概率XML数据处理方法以及SLCA关键字检索算法相结合,提出了基于SLCA的概率XML数据关键字检索算法和改进的基于SLCA的关键字检索算法。基于SLCA的概率XML数据关键字检索算法通过遍历概率XML数据,根据概率XML数据中概率分布节点来生成普通XML数据。在普通XML数据上执行关键字检索算法。当XML数据集很大时,处理XML数据将变成一个十分繁琐的问题。因此本文在该算法的基础上提出了改进的基于SLCA的概率XML数据关键字检索算法。算法通过阈值的设定和概率值的计算,将会减少所生成的XML数据量。由于减少了大量的检索数据,在进行关键字检索时会缩短检索时间,实现算法的优化。
其他文献
现代经济高速运转的需求带动了信息技术的迅猛发展,而信息化管理成为了企事业单位生存和发展所采用的普遍对策,建设教学管理信息系统是现代学校信息化管理的重要基础和核心内
随着多核处理器的不断发展,应用程序对计算机性能提出了更高的要求,然而由于多核处理器每个核心的处理能力通常都比以往的单核处理器弱,使用多核处理器并不能直接带来高性能,
传统数据挖掘的对象是单一关系表中的数据。对于许多实际应用,数据是存储在多个关系表中,先要把多关系数据集成到一个单一关系中,这需要大量的预处理工作,并且会导致信息丢失
月球作为与地球关系最为密切的天体,对月球进行探测是人类深空探测的第一步。近年来,许多国家先后宣布了新的月球探测计划,表明了自己探月的雄心壮志。地月转移轨道的设计是月球
知识图谱是人工智能技术发展进程中的一大进步,它把非结构化与半结构化数据组织成了同时易于人类与机器理解的图结构,为机器实现智能化提供了知识上的支持。近年来,知识图谱技术
目前,(?)Veb Services技术正受到产业界和学术界越来越多的关注,其应用也越来越广泛,出现了不少功能相同或相似的Web服务。在功能驱动的Web服务组合中,代表非功能属性的QoS与
随着当今网络通信技术的高速发展,网络规模不断的扩大,复杂度不断的增加,如何可视化的管理如此庞大、复杂的网络,成为网络管理系统面临的一项重大任务。可视化的管理可以分为
对密文关系的查询处理是DAS模型面临的主要问题之一。目前,现有加密方案和索引方法均存在查询命中率低的缺陷,造成了不必要的网络堵塞。减少查询结果中冗余数据的数量是解决
系统发生分析领域的多序列比对和系统发生树构建等问题都是NP-难问题。本文针对这些问题,对蚁群算法进行性能改进及参数分析,提出两种改进蚁群算法;并基于蚁群算法提出两种多
空间搜索能力与局面估值的准确性是决定棋类游戏水平高低的最重要的两个方面。六子棋游戏规则简单,但状态空间复杂度高,平均分枝因子大。该特点限制了六子棋程序中博弈树搜索