论文部分内容阅读
为了在大规模的图像数据中检索出与目标图像高度相似的图像,利用Hadoop平台对海量图像数据进行分布式存储和处理。利用SIFT算法提取图像特征,获得大量图像特征点;然后利用K-means算法对图像特征点进行聚类,降低特征点数量,提高图像检索效率。并利用TF-IDF算法对图像聚类中心进行量化,获取聚类中心的TF-IDF值,优化图像检索结果。最后利用HDFS对海量图像数据进行分布式存储,利用MapReduce实现相关算法。