【摘 要】
:
目前,针对嵌套式数据集上的高效查询处理已成为Web数据检索的一个重要任务.不同于传统信息检索,嵌套式数据集既要存储数据又要存储结构,导致了针对该类数据集查询的低效性,特
【机 构】
:
上海理工大学光电信息与计算机工程学院;
【基金项目】
:
国家自然科学基金项目(61003031)资助;上海市自然科学基金项目(10ZR1421100)资助;上海市研究生创新基金项目(JWCXSL1302)资助
论文部分内容阅读
目前,针对嵌套式数据集上的高效查询处理已成为Web数据检索的一个重要任务.不同于传统信息检索,嵌套式数据集既要存储数据又要存储结构,导致了针对该类数据集查询的低效性,特别是对如何保证精确查询效率更是一个挑战.结合列存储结构和倒排索引技术,首先定义了表达嵌套式数据集中数据位置信息的唯一路径UPath,提出一种新的支持嵌套式数据集精确查询的索引结构——Uni Hash.在此基础上,给出了生成数据值的唯一路径UPath以及基于MapReduce框架建立Uni Hash索引的相关算法.通过将其与XPath检索进行对比,验证了Uni Hash索引结构的有效性.实验表明,将嵌套式数据集进行列式存储并建立Uni Hash索引,能够明显地提高精确查询的效率.
其他文献
与在所有特征空间寻找聚类不同,子空间聚类的目标是找到嵌在不同子空间的簇,是实现高维数据聚类的有效途径.传统聚类算法主要采用基于距离测量的方法进行聚类,难以处理高维数
二元液系气液平衡相图实验是物理化学基础实验之一。在该实验中最困扰大家的是溶液的配制问题,因为只有合理地配制溶液才能使数据点在相图里分布合理。文章采用依次添加法配
传播学领域对福柯一直有着持续的研究兴趣,若要恰当地把福柯理论运用到传播学研究,首先必须尽可能准确地把握福柯的整个理论体系,从而理解福柯思想与传播学研究的交集域。本
当前中国农村金融创新存在的主要问题在于:人力资本严重不足,导致农村金融创新缺乏内在动力;未能满足市场特殊需求,导致农村金融创新应用效果不佳;业务拓展格局不合理,影响农
论文从Verschueren的顺应性理论出发,阐述了汉语广告英译也是一个不断选择-顺应的过程,并从译文读者的消费心理、英语广告中“顾客至上”的信念、译文读者的消费信息需求、译
中国现当代诗歌受西方象征主义文艺思潮的影响颇大,从五四新诗到20世纪70、80年代的朦胧诗都可见到象征主义的影子。但随着研究的深入,有人发现象征主义的诗歌理论与我国古代
“问渠那得清如许,为有源头活水来”.于考试命题而言,教材是包括高考在内的各类考试试题的主要来源.纵观2013年福建省高考文理科试卷,可以看出:命题立足《课标》,坚持能力立
从界定大学生手机媒介素养的内涵,设计大学生手机媒介素养教育主题活动等方面展开,设计的一个实践案例作为指导等。通过主题教育活动,提高大学生手机媒介素养,培养公民意识和
我国税收信息化建设正处于信息大集中的建设阶段,数据、业务的集中同时意味着风险的集中,本文就税务信息系统的风险防范进行研究和探讨。