基于互联网的人脸图像搜索

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tianshiye45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的日渐多样化,在实际的互联网应用中,存在着大量对名人、明星、罪犯、热门图像等特定人脸图像的搜索需求。传统的文本检索具有检索方式单一的局限性以及检索精度易受关键字欺骗等不足,而通用的图像搜索难以满足特定领域的精度需求以及检索易受到背景图像的干扰,因此这两种方法都无法满足互联网上人脸图像的检索需求,需要采用文本信息、图像内容以及特定领域相关知识相结合的方式达到更丰富的查询方式和更精确的检索性能。基于互联网的可扩展的垂直图像检索框架是一种综合利用文本信息、图像内容以及特定领域相关知识的框架,通过引入特定领域中文分词、网页相关性分析、非特定领域图像过滤等关键技术,能过滤掉不相关图像以及去除图像中背景区域的干扰,通过采用更精准的特征向量表征图像,实现了更精确的检索性能。基于互联网的人脸图像检索系统主要在此基础上引入非人脸图像过滤,以及人脸特征提取和匹配,实现基于互联网的人脸图像检索。非人脸图像过滤模块能在系统的数据收集过程中过滤掉不相关的网页以及不包含人脸的图像。在页面抓取阶段利用网页相关性分析直接跳过不相关网页,减少数据下载量以提高网页下载质量,对入库图像利用AdaBoost Cascade算法过滤不含有人脸的图像并提取人脸区域,排除背景区域干扰,提高了系统检索性能。特征提取模块针对提取的人脸区域引入LGBP算法,通过性能均衡测试选取合适参数提取特征向量,并采用直方图相交算法进行匹配,在保证检索精度的同时减少了匹配时间。同时对该算法进行扩充,提出了基于空间金字塔模型的PLGBP算法,该方法以牺牲匹配时间为代价提高了检索精确度。此外,基于互联网的人脸图像检索系统还用到了中文分词、倒排索引、以及相关反馈等技术。系统综合利用文本语义信息,图像视觉特征以及人脸领域相关算法,从抓取的100多万页面中解析并得到220913张人脸数据,在关键字与图像的融合检索性能测试中取得70%的平均查准率,响应时间在7S以内。
其他文献
学位
随着互联网上的信息量越来越大,传统的通用搜索引擎对信息的查找、索引越发显得力不从心,逐渐显露出“准确性差、时效性差、覆盖率低”等弊端。通用搜索引擎立意于满足用户的
无线多媒体传感器网络是一种追求感知信息类型多样化的新型传感器网络,通过使用多媒体传感器节点,它能采集音频、视频、图像等多媒体信息。由于存在多种类型的数据分组,MAC协议
近年来,随着在线社会网络的不断发展和计算机系统处理能力的不断提高,社会网络分析和挖掘成为热门的研究领域。大部分对社会网络的研究集中在只有正链接的网络,本文研究对象
随着网络对传统出版物和媒体的冲击,用户对于新闻浏览习惯发生了改变,越来越多的人养成了每天在网络上浏览新闻的习惯。本文研究如何高效、准确地从海量的新闻和新闻评论中找
近年来,云计算技术在学术界和工业界都成为关注的热点。大型数据中心提供的服务,尤其是Web应用,以及使用的各种虚拟化技术构成了云计算的基础架构。数据中心中通常拥有大量的
数据存储策略的研究是无线传感器网络有关数据管理与处理的一项重要研究内容。其本质就是尽可能有效地利用有限的存储空间和有限的节点能量,将感知数据存储在网络中的某个确
逆向工程是近年来发展非常迅速的一个研究领域,应用领域非常广泛,是CAD/CAM领域缩短产品再设计与制造周期的重要技术之一。而曲面重构问题正是逆向工程中的关键内容。而随着
随着数据规模的不断扩大和用户数量的急剧增加,传统的结构化数据库访问面临的压力越来越大,提高MySQL等结构化数据库的读写性能成了一个亟待解决的问题。Redis内存数据库将所
随着微电子技术、通信技术和嵌入式计算技术的发展与进步,无线传感器网络得到了广泛地应用,并引起了国内外研究人员的的极大关注。为此,本文对无线传感器网络中具有重要意义