【摘 要】
:
随着互联网的飞速发展,从互联网上抓取的数据呈现几何级增长,一方面对网页的存储增加了技术难度,另一方面如何处理PB级别的数据也是摆在工程师面前的技术难题。传统的单机数据处
论文部分内容阅读
随着互联网的飞速发展,从互联网上抓取的数据呈现几何级增长,一方面对网页的存储增加了技术难度,另一方面如何处理PB级别的数据也是摆在工程师面前的技术难题。传统的单机数据处理,虽然十分方便,但所耗时间很长,对于当前情况根本无法满足,所以需要采用分布式方式进行数据处理。而采用分布式处理海量数据,就需要进行并行化程序设计。本系统服务平台就是为了解决策略研发人员方便进行分布式索引建库进行开发的。针对大数据量建库的问题,主要的解决方法是采用分布式存储和计算,利用开源的Hadoop框架完成整体流程。利用Hadoop自身强大的兼容性和易开发性,将大数据分而治之,并结合Hadoop自身的排序机制,完成数据的定向分配和处理,生成最终供用户使用的索引文件;针对研发人员经常调研新的排序策略,而且分布式索引建库需要在同一集群上并行运行,系统解决的方式是给用户提供一个可配置的建库申请文件,在文件中自定义自己的程序信息,保证不同用户可以并行启动分布式建库任务;针对用户对建库过程不了解的问题,采用统一服务平台接口,用户只需提供相应的建库请求文件,即可完成最终的索引并传输至指定的机器,同时在建库过程中,为了使用户及时了解索引建库进度,系统采用阶段性邮件通知,使建库的细节过程更加透明。本文对上述问题提供了合理的解决方案,同时采用C/C++以及Shell语言在Hadoop分布式环境下具体实现了用于图片检索的分布式建库服务平台。经过测试表明,本系统平台能够方便为多用户提供分布式建库服务,而且由于用户采用该统一建库服务平台,只是每次策略不同,系统也更加容易维护升级。
其他文献
TDICCD由于其高信噪比、高灵敏度等优点被广泛使用于遥感领域,也由于TDI探测器的工作特性使遥感器成像质量受振动像移的影响敏感,尤其是随机振动像移由于其运动形式的不确定性
全球范围内地震灾害频发,给相关国家和人民造成了巨大的生命和财产损失。在救援工作中,救援人员多是采用手动工具在复杂的废墟环境中完成切割、起缝和空间顶撑,以打通救援通道。
薪酬激励机制是企业使用薪金对员工或团队进行刺激,为实现某种目标或更快有效的提高生产率采取的薪酬激励行为,对于员工以及团队的积极性有着不可忽视的重要性做好薪酬激励机
文物古建筑应该同周边环境做为一个整体进行保护规划。在介绍了文物古建筑保护规划中保护范围划定的意义和原则后,又说明了保护的方法。保护范围的划定主要包括保护区的范围
本文主要研究了用于电动汽车电池高速装箱的X2并联机器人系统的设计。该系统与现有的电动汽车电池装箱方案相比,具有较大工作空间与机构体积比,机械性能良好,机构简单,生产成本低
本文以媒介生态学的视角,分析了陕南农村大众传播媒介的畸形结构与传播功能严重失衡的现状,提出了改善和调节农村媒介生态,充分发挥大众传媒在建设社会主义新农村进程中信息
中国的传统戏曲艺术从早期露天广场的演出,到勾栏瓦肆的厅堂演出,再到剧场演出,并且随着影视业的发展,出现了广播、影视戏曲,当今网络技术的发达,也促使了网络戏曲的应运而生
抗性淀粉测定的方法主要有Englyst法、Berry法、S.A.法和Goni法,本文通过测定不同实验处理的大米抗性淀粉,对S.A.法和Goni法进行了比较研究。结果表明,Goni法比S.A.法具有重
随着人类对太空资源的开发和利用,空间任务越来越多,自由漂浮柔性双臂空间机器人的研究受到了广泛的关注。由于太空环境和机器人结构的特殊性,柔性机械臂在运动过程中发生变形和
我国在中药检验当中引入色谱技术的时期较晚,利用时间也较短,但大量实践表明,将色谱技术应用于中药检验当中可提高中药检测质量及工作效率,有利促进我国中药检测行业的快速发