基于Hadoop的图像存储和检索的研究与实现

来源 :现代计算机 | 被引量 : 3次 | 上传用户:a13600660175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了在大规模的图像数据中检索出与目标图像高度相似的图像,利用Hadoop平台对海量图像数据进行分布式存储和处理。利用SIFT算法提取图像特征,获得大量图像特征点;然后利用K-means算法对图像特征点进行聚类,降低特征点数量,提高图像检索效率。并利用TF-IDF算法对图像聚类中心进行量化,获取聚类中心的TF-IDF值,优化图像检索结果。最后利用HDFS对海量图像数据进行分布式存储,利用MapReduce实现相关算法。
其他文献
从善之1914年发表在《地学杂志》第6期上的《萨满教》一文算起,中国的萨满教研究已走过了百年的历程。萨满文化是民间文化的综合体,是一个综合性的研究对象,涉及诸多学科,研
目的 探讨限制性输血在急性上消化道大出血救治过程中的效果。方法 选取2014年1月~2016年10月我科收治的78例急性上消化道大出血患者作为研究对象,按照随机原则分为对照组和观
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
产业集聚程度体现了产业空间布局状况。选择区位熵作为衡量制造业聚集程度的指标,利用主成分分析法和回归分析法,探讨宁镇扬三市的生产性服务业和制造业之间的协同增长与集聚关
计划并实现一种Peer-to-Peer 分布式文件共享方式。在同一局域网中,对于设置为共享的资源,由系统自动提交共享目录结构,其他网络用户可使用通用的搜索入口进行查询并下载。采
<正>目的探讨大剂量乌司他丁不同给药方法(间断静脉给药与微泵持续静脉给药)对急性循环障碍近期临床结局的影响。方法采用前瞻性、随机、对照临床实验,应用随机排列表将患者
会议
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
尿崩症是由于抗利尿激素(AVP)的产生不足(中枢性尿崩症,CDI)或作用障碍(肾性尿崩症,NDI)使肾脏不能将原尿浓缩而排出大量低渗尿的一组临床综合征。临床上主要表现为脱水所致的
会议是各级党政机关部署工作的重要手段,会务工作的质量与水平直接影响到决策及其落实的质量和水平。而作为党政机关的秘书,最常处理的工作除了撰写文字材料外,大概就是负责