一种基于Spark的分布式时态索引方法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:xyfall533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于Spark分布式计算平台提出一种分布式时态索引方法。该方法提出时态数据集的分段索引构造策略,对每一分段设计基于Spark的时态索引构建方法及基于Spark RDD的并行查询策略;根据时态查询所涉及的Spark RDD分区模式的不同,将其分为分区独立查询,跨区查询以及跨段查询,并分别针对不同模式的时态查询提出优化的辅助索引结构,提高查询效率;在基准数据上进行实验,验证了所提索引策略的实用性和高效性,同时表明所提方法对数据规模的有效自扩展性以及降低了集群硬件配置需求。
其他文献
本文以1943年7月在抗日“陪都”重庆创办、由沈子善先生主编的五期《书学》杂志为研究对象,运用文献实证的方法对《书学》杂志的出版、编撰队伍、用稿取向等作了整体的分析与
研究目的:探讨抗结核药物性肝损伤发生的临床特点、易感因素及不同治疗方案对药物性肝损伤的影响。研究方法:回顾性分析2008年至2012年北京胸科医院结核病患者发生ATDILI的临床
英语习得中的"被动泛化"现象得到了广泛的关注,汉语习得中"被动泛化"的研究却还少之又少。从二语习得的角度说,把作格动词和非宾格动词分开研究是一条可行的途径。韩语母语者
公益性出版是当前我国推进公共文化服务体系建设的一个重要环节,有利于让更多普通大众通过免费或花费较少经济成本就能够阅读到中华民族的优秀文化作品,有利于更加充分地保障广
《申报》1872年4月在上海创刊,是全国著名大报。其副刊《自由谈》长期由“鸳鸯蝴蝶派”文人主编,副刊内容多为风花雪月的戏谑小说、市井趣闻。在“九·一八”、“一·二八”事
网络环境下,网络服务提供者作为一种特殊的侵权主体,其不仅是支撑网络信息产业健康有序发展的中坚力量,同时其服务也为网络用户的侵权搭建了侵权便道。为此,网络服务提供者是否构
《解放》周刊(1937-1941)作为抗日战争时期中共在延安的党刊,对抗日民族统一战线的建立及中国共产党影响力的扩大有着重要的意义,而“时评”专栏作为其重要的组成部分,通过犀利的
魏源,中国近代史上开风气之先,著作等身,编辑了诸多大部头著作,可以说魏源的编辑活动贯穿魏源之一生。本文通过对魏源所处的时代环境进行分析,考察魏源自身成长历程以及对魏源诸多
20世纪80年代初,随着我国计划经济体制向市场经济体制的逐步转变,教育、科学、文化事业的发展和图书出版需求的快速增长,自费出版这种特殊的出版方式应运而生。自费出版在我国产
基于三年以来对海南农垦体制变迁的调查研究,通过对已有文献的阅读整理,发现市场化制度变迁是海南农垦体制改革进程的关键所在。但目前对该命题的研究尚未发现有比较成熟的成