XML数据流上的TOP-K关键字查询处理

来源 :第二十五届中国数据库学术会议(NDBC2008) | 被引量 : 0次 | 上传用户：youlanbihai

【摘要】

：

利用关键字可以在模式未知的情况下对XML数据进行查询.提出了一种面向XML数据流的关键字查询技术——TOP-K关键字查询.这类查询在模式未知的情况下,对用户给出的关键字集合和

【作者】

：

黎玲利王宏志李建中骆吉洲

【机构】

：

哈尔滨工业大学计算机科学与技术学院哈尔滨150001

【出处】

：

第二十五届中国数据库学术会议(NDBC2008)

【发表日期】

：

2008年10期

【关键词】

：

XML数据数据流关键字查询 TOP-K 可扩展性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

利用关键字可以在模式未知的情况下对XML数据进行查询.提出了一种面向XML数据流的关键字查询技术——TOP-K关键字查询.这类查询在模式未知的情况下,对用户给出的关键字集合和结果个数K,随时给出接收到数据中前K个与关键字集合最相关的XML数据片断.为了有效地处理TOP-K关键字查询,本文设计了一种基于栈的算法,可以动态地维护临时结果集合并有效地过滤掉无用的元素.本文通过实验对算法的有效性和可扩展性进行了验证.

其他文献

基于KNN-Join和SNN相似度的空间异常点检测算法

空间异常点是和其空间邻域对象不一致的数据对象或者在数据集中远远偏离其他对象的那些小比例时象.空间异常点的检测在地理信息系统和空间数据库的应用中都有着重要的意义。

会议

空间属性异常点非空间属性异常点KNN-JoinSNN相似度空间异常点数据集地理信息系统

基于ESAX表示的时间序列相似性度量

时间序列的近似表示和相似性度量是时间序列挖掘的研究基础,对提高挖掘任务的效率和准确性至关重要.基于时间序列的ESAX(Extended Symbolic Aggregate Approximation)近似表

会议

ESAX表示时间序列挖掘相似性度量符号化统计向量

黄宗英自述(上)

一我,黄宗英。1925年7月13日,即民国十四年五月二十三日生于北京,属牛。母亲怀我产期未到,忽阵痛,赶忙遣人去请产婆。产婆未到,我就已经生出来了。家人都说我是急性子。母亲

期刊

黄宗英甜姐儿怀我孙道临大弟南北剧社黄佐临职业剧团卫禹平对我说

基于反馈的用户访问预测模型

用户的访问预测是Web日志挖掘的重要分支,在过去的几年里,研究者们先后提出了基于关联规则、Markov模型、频繁访问模式和点击流树等预测模型.它们不考虑用户的反馈,无法判断

会议

对高职教务管理系统的研究

近几年,我国高等教育在招生规模上持续扩大,传统的手工管理方式工作量大,费时、费力、效率低,而各高校教务管理工作的“个性”化而又不宜采用商业化的教务软件。现着重介绍一

期刊

C/S模式B/S模式教务管理管理信息系统

支持向量机Top-k查询的特征空间近邻索引

特征空间索引是提高大规模支持向量机SVM(Support Vector Machine)查询效率的关键,在多媒体数据库及信息检索领域具有重要的应用前景.为了进一步提高SVM特征空间索引的效率,

会议

Hash-Search:基于哈希表的快速XML关键字检索算法

随着XML的广泛应用,XML上的关键字检索逐渐成为一个研究热点.现有的关键字检索方法主要基于LCA计算和候选点选择两种操作,存在以下问题:首先,现有方法利用Dewey编码来表示结

会议

基于多级服务属性的Web服务替换策略研究

针对某些Web服务应用允许服务功能衰减这一事实,提出了多级服务属性的概念,即合成服务在不同的时刻满足的服务属性不同,用一个含有逐级弱化关系的服务属性集合表示服务功能,

会议

多级服务属性Web服务替换策略服务功能属性集合合成服务衰减弱化基础关系概念

木耳多糖的制备及辐射防护作用实验研究

期刊

辐射防护木耳多糖实验动物银耳多糖茚三酮试验γ射线真菌门注射给药含量指标总多糖

一种基于数据分布差异度的子空间聚类算法

随着聚类技术应用范围的不断扩大,传统的聚类方法已不能满足对高维数据的分析要求.对高维数据的聚类分析,要求算法不仅要发现簇,而且还要发现存在簇的子空间.使用子空间聚类

会议

XML数据流上的TOP-K关键字查询处理

与本文相关的学术论文