复杂条件下基于形状特征的图像检索

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:gaolch013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索一直是多媒体技术领域的研究热点,同时也被广泛地应用在搜索引擎、商标检索和电商贸易等领域。本文的应用背景是电商贸易下的酒瓶检索,由于酒瓶生产可以后期上色,因此形状是最主要的区分特征,而分割是形状特征提取的必要步骤。本文所针对的数据集包括数据库图片和检索图片。数据库图片存在渐变背景噪声、横线噪声及弱边缘的分割难点。由于酒瓶光滑、透明及光照不均匀等原因,检索图片常常具有很复杂的环境条件:反射、折射产生的高光以及酒瓶透明、物体阴影导致的灰度极度不均匀,以及弱边缘和边缘缺失。本文数据集形状还具有类内差异大、类间距离小的难点,并且实际应用系统要求在30秒内返回前16个相似图片。本文分为数据库图片分割、检索图片分割和形状检索三大步骤,每个步骤分别对上述的难点进行了研究与解决。本文的主要的贡献如下:1、针对数据库图片的分割难点,对区域生长法进行了改进。该方法使用前景概率图对区域的生长准则进行自适应缩放,既保留了区域生长法能滤除渐变背景噪声的特性又能分割弱边缘,同时使用闭操作处理横线噪声,最终完成了数据库图片的分割。2、针对检索图片的高光问题,提出了一种反射、折射通用的高光区域检测方法。本方法根据反射和折射高光的亮度、区域相似性进行高光区域的初始化和筛查,对检测出的高光区域进行高光去除,作为检索图片分割的预处理以缓解灰度不均匀问题。3、针对检索图片的复杂环境条件及时间限制,提出了基于图割一步优化的GAC算法。本算法将基于GVF力场的GAC模型离散化并映射成图中的边界项,使用改进的区域生长法生成初始概率图作为区域项的初始化,改善严重灰度不均匀的同时令整个模型可以一步优化。在检索图片上MIoU达到了91.03%,比One Cuts高36.36%,时间快了4.5倍,比GAC模型高11.23%,时间上最少快了386倍。4、针对本文形状检索难点和时间限制,提出了基于改进SC的词袋检索模型。首先提出了基于归一化残差编码的SC特征,使用采样点相对栅格中心的归一化二维残差对形状进行更精确的表示;然后将轮廓分成多个轮廓段,对训练图片所有轮廓段提取上述改进的SC后进行聚类、编码、池化及SVM训练;接着使用SVM有监督的权重生成对池化特征的权重,最终对池化后特征加权得到可用于快速检索的形状特征。本方法在检索数据集上达到了65.62%的mAP,相比排名第二的检索指标高出42.64%。本文工作为解决复杂条件下的分割以及类内差异小的快速形状检索的核心技术问题提供了可行性方案,为设计实用的酒瓶检索系统奠定了基础。
其他文献
在全球商业纽带日益紧密的大背景下,中国的对外开放程度不断提高,越来越多的中国民众把出境游作为休闲放松的一种方式,来华寻求旅游类商业合作的公司和机构数量不断增多,各类
攀岩是从登山运动中衍生出来的一项运动,起源于20世纪50年代的前苏联军中。随后,流行于欧美崇尚自然、喜欢冒险的登山爱好者中。1985年,法国人弗兰西斯·沙威格尼发明了可以
改革开放以来,我国精神文明建设日益进步,新时期的文化发展过程中,各类文化呈现出相互交流、相互进步的繁荣景象,人民对文化生活的要求越来越高,群众文化的构建与发展十分关
明朝永乐年间。在元朝的基础上,运河又得到了一番改进。明成祖朱棣迁都北京,派平江伯陈碹疏浚江淮运河。又命工部尚书宋礼修治会通河(包括济州河在内),京杭大运河始畅通。清代继承
目的分析施杞教授诊治强直性脊柱炎遣方用药规律,为临床提供参考。方法收集施教授2012年1月-2018年2月于上海中医药大学附属龙华医院、附属光华医院及附属岳阳医院特需门诊治
近几年来,随着信息技术的发展和景观生态学及生态经济学被引入到荒溪治理中来, 荒溪治理研究在研究理论和研究手段方面都有了新的进展.本文综述了国内外荒溪治理的研 究进展
滑翔伞的历史,可以追溯到1978年。那一年,法国登山家贝登利用一顶方形降落伞从阿尔卑斯山上成功地飞降到山下,一项新奇的运动宣告诞生。后来,其他登山家们纷纷效仿,并对降落伞进行
在现代信息背景下如何构建多元主体参与的网络化国家治理体系,是国际社会所面临的重要课题。必须摒弃传统的政府管理思维,重塑现代社会治理的体制与管理机制的科学方法、途径与
在完成DSSAT(4.0.1.0)中CERES-Maize模型参数的校正和验证之后,利用30年(1976-2005年)的气象资料针对北京地区的春玉米生产进行模拟。结果表明,在充分灌溉的条件下,春玉米4月底播
本文围绕西门子200SmartPLC在皮带集控系统中与皮带控制器之间建立通信做出介绍。双方依照MODBUS RTU通信协议,实现皮带机运行参数及保护状态的读取;逻辑控制指令经西门子200