MapReduce环境下支持精确查询的嵌套式数据索引技术

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:gaowufida
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,针对嵌套式数据集上的高效查询处理已成为Web数据检索的一个重要任务.不同于传统信息检索,嵌套式数据集既要存储数据又要存储结构,导致了针对该类数据集查询的低效性,特别是对如何保证精确查询效率更是一个挑战.结合列存储结构和倒排索引技术,首先定义了表达嵌套式数据集中数据位置信息的唯一路径UPath,提出一种新的支持嵌套式数据集精确查询的索引结构——Uni Hash.在此基础上,给出了生成数据值的唯一路径UPath以及基于MapReduce框架建立Uni Hash索引的相关算法.通过将其与XPath检索进行对比,验证了Uni Hash索引结构的有效性.实验表明,将嵌套式数据集进行列式存储并建立Uni Hash索引,能够明显地提高精确查询的效率.
其他文献
期刊
与在所有特征空间寻找聚类不同,子空间聚类的目标是找到嵌在不同子空间的簇,是实现高维数据聚类的有效途径.传统聚类算法主要采用基于距离测量的方法进行聚类,难以处理高维数
二元液系气液平衡相图实验是物理化学基础实验之一。在该实验中最困扰大家的是溶液的配制问题,因为只有合理地配制溶液才能使数据点在相图里分布合理。文章采用依次添加法配
传播学领域对福柯一直有着持续的研究兴趣,若要恰当地把福柯理论运用到传播学研究,首先必须尽可能准确地把握福柯的整个理论体系,从而理解福柯思想与传播学研究的交集域。本
当前中国农村金融创新存在的主要问题在于:人力资本严重不足,导致农村金融创新缺乏内在动力;未能满足市场特殊需求,导致农村金融创新应用效果不佳;业务拓展格局不合理,影响农
论文从Verschueren的顺应性理论出发,阐述了汉语广告英译也是一个不断选择-顺应的过程,并从译文读者的消费心理、英语广告中“顾客至上”的信念、译文读者的消费信息需求、译
中国现当代诗歌受西方象征主义文艺思潮的影响颇大,从五四新诗到20世纪70、80年代的朦胧诗都可见到象征主义的影子。但随着研究的深入,有人发现象征主义的诗歌理论与我国古代
“问渠那得清如许,为有源头活水来”.于考试命题而言,教材是包括高考在内的各类考试试题的主要来源.纵观2013年福建省高考文理科试卷,可以看出:命题立足《课标》,坚持能力立
从界定大学生手机媒介素养的内涵,设计大学生手机媒介素养教育主题活动等方面展开,设计的一个实践案例作为指导等。通过主题教育活动,提高大学生手机媒介素养,培养公民意识和
我国税收信息化建设正处于信息大集中的建设阶段,数据、业务的集中同时意味着风险的集中,本文就税务信息系统的风险防范进行研究和探讨。