增量式图像测试集构建技术的研究与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:wkkyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对产品外观质量检测的工业领域,应用于生产线上基于视觉的图像处理算法,在实时监控产品外观形态、准确定位不合格产品的任务中至关重要。然而,此类算法在设计之初很难充分考虑生产线上产品的特性,导致其在线上使用过程中出现不可避免的版本更新,既降低了算法的可信性,也无法保证各版本之间的稳定性。合理有效算法测试环节的引入,能有效避免此类问题的发生。因此,依托生产线上已采集的海量产品图像库,构建一个数量适中、包含产品各种形态的图像测试集,已成为测试人员一项亟待解决的问题。论文分析了构建图像测试集在测试图像处理算法中的地位,结合国内外算法测试关键技术、特征提取技术、增量聚类技术的研究现状,解析了构建增量式图像测试集的主要难点,并给出了具体的解决方案,主要包括基础图像的聚类算法,增量图像的聚类算法、增量图像和基础图像分类结果的融合、算法测试数据集的图像拣选、算法平台系统的设计与实现等,并投入实际项目中验证。在产品图像数据集的分类管理方面,主要提出了基础图像聚类算法和增量式图像聚类算法。前者主要围绕图像全局特征和局部特征展开,包括灰度图向量化特征、LBP特征和SIFT特征。对图像的聚类可根据用户选择,基于不同的特征开展,产生供测试人员交叉验证的结果,减弱特征选择对聚类结果的影响,增加图像分类的可信性和可靠性。增量式聚类算法能够智能处理新增图像库的归类和分类问题,通过计算新增图像和已有类心的距离,比对算法根据增量次数自适应设定的类内距离,决定新增图像是归类还是再分类,从而在保留原有图像集分类的基础上,智能更新增量图像的分类。同时,聚类中心比率概念的提出,能够将增量图像和原始图像的分类比率控制在相同水平,减少了当前聚类算法需要人工多次干预的繁琐工作。在图像测试集的拣选方面,通过设计图像筛选算法,一方面保证所选图像之间能够具有最大的差异性,尽可能消除重复图像,另一方面极大程度削弱了图像分类错误可能造成的影响。通过人工指定每个类别待选择图像的数量,根据每类图像和其类心的距离确定选择间距,保证所选出的类内若干图像在该类别中具有最大的差异性。在平台的设计与实现方面,主要开发了特征提取、特征降维、基础图像聚类、增量图像聚类、图像筛选等功能模块,各个功能模块既相辅相成、协同工作,同时亦可独立执行任务,方便测试人员根据实际测试任务需求,构建更具有针对性的图像测试集。同时提供多个接口,为人工调控图像测试集的构建提供便利。本文所提方法和系统已在实际工程项目中投入使用,极大程度提高了测试工作的效率,降低了人工操作成本,具有重要的应用价值。其创新点或特点在于:●研究了算法测试中输入数据的构建问题,区别于传统算法测试对功能测试、流程设计的关注,更强调构建算法测试输入数据集的重要性;●提出了一种面向增量式图像测试集构建的聚类算法,有效解决了海量产品图像分类管理的问题;●提出了一种类内差异性最大的图像筛选算法,确保了被拣选作为算法测试输入的图像之间具有最大的差异性;●开发了一套构建增量式图像测试集的平台系统,通过高内聚、低耦合的设计,保证系统重用性和可扩展性,用以解决项目中的实际问题。
其他文献
自改革开放以来,民营经济作为我国社会主义经济的重要组成部分得到了长远的发展,在发展速度、发展规模、经济总量等方便取得了举世瞩目的成就,已成为和国有经济、集体经济并行的三大主体经济之一。据相关统计,民营经济占我国GDP总量的比重已经超过60%,占税收的比重约占50%,占就业的比重约占80%,民营经济在我国经济发展中正发挥着越来越大的作用。但从国际产业分工角度观察,中国经济,尤其是中国民营经济,仍处于
学位
对吉凶福祸的关注植根于人之本性,渗透在人类的日常生产、生活之中。福祸观念表现的不止是人们祈福避祸的本性和祈福禳灾的努力,而且包含着对终极生命意义的关怀。本文主要依据《尚书》、《左传》、《国语》等传世史料,与甲骨文、青铜器铭文等出土资料,考察先秦时期人们的福祸观念。由于史料本身的性质,文章主要关注中原国家贵族社会的福祸观念。文章共分为五个部分。前言部分主要交待研究综述。第一章考察殷商、西周时期贵族社
近年来,我国经济发展速度总体放缓,新增就业人数持续增长,就业形势越来越严峻。南京市作为长江三角洲的中心城市之一,就业形势虽然受外界经济形势影响较小,在南京市政府的努力之下促进就业工作取得了一定的进展,但仍然存在较大的就业缺口,亟需得到解决。居民创业活动对解决我国就业问题有重大积极意义,南京市虽然拥有扎实的工业基础和健全的产业体系,社会文化氛围优良,资源人才优势显著,但相比上海、浙江的居民创业活动严
虽然已经有众多学者对期权定价理论进行了深入研究,但是我国场内期权方面的实证类研究几乎空白,这主要是因为缺失国内期权的数据样本。随着50ETF期权产品的推出,这一情况已经发生改变,本文参考期权领域前沿定价模型和算法,结合中国资本市场实际状况,建立上证50ETF最优定价模型。根据Merton(1974)发表的论文中提出的评价模型的四个尺度,本文强调定价模型对现实情况的捕捉,选择并进行实证研究的几个或者
百回本小说《西游记》成书后,明、清两代产生了大量的西游故事戏,其中,京剧猴戏是最为耀眼、并对后世产生巨大影响的一种。京剧猴戏分为京、海两派。京派猴戏产生于清代中叶,并在晚清这一帝国分崩离析的复杂历史时期走向繁荣。它发展、鼎盛于紫禁城内的宫廷大戏台,猴戏武生杨月楼、杨小楼等人作为“内廷供奉”,以一种天生骄傲的贵族姿态存在于庚子年以后的海上梨园界。杨小楼的“武戏文唱”也成为了传统猴戏的余辉。相较而言,
随着当前我国制造业的传统竞争优势如低廉的劳动力成本等逐渐消失,以及顾客需求日益呈现多样化、个性化趋势,越来越多的制造企业开始实施服务化战略,服务化已经成为我国当前制造业转型升级、重建竞争优势的重要途径。然而,制造企业在实施服务化战略时往往会遭遇“服务悖论”现象:企业在服务业务中投入巨大,却无法获得相应的收益。如何解决制造企业的“服务悖论”,帮助制造企业获取服务化战略的收益就成为服务化研究领域亟需回
最近几年,国家出台职称评定政策,在职称评定上开始向乡村教师倾斜,在职称评定的条件上给予放宽,在名额上给予增加。新的职称评定政策出台后,特别是职称评定的名额向基层乡镇教师放开后,乡镇中学教师对新的职称评定政策满意度如何引起了研究者的兴趣,因此提出了对乡镇中学教师的职称评定满意度的研究。新的职称评定政策对于边远艰苦地区乡村教师来说,他们的绩效工资、职称评聘、福利待遇得到大幅度改善。但职称评聘方面各地区
恶性肿瘤由于难以治愈、易复发和高死亡率的特性,现已成为当今社会人类健康问题的头号隐患。相比正常细胞,恶性肿瘤细胞具有高转移和强侵袭的生物学特性,而90%以上的癌症患者死于肿瘤转移,发生转移的癌症患者生存期平均一般不超过五年。因此,控制癌症的扩散和转移是癌症治疗的关键所在。腺瘤性息肉蛋白APC,是一种重要的肿瘤抑制蛋白。癌症患者的APC基因往往发生基因突变,表达为截短型APC。截短型APC不再发挥正
改革开放以来,随着市场经济制度的确立,我国开始拥有真正意义上的现代化公司,多元化经营的理念逐渐进入中国企业家的视野。半个世纪以来,多元化经营能否提高公司经营业绩一直是有争议的话题,公司根据自身发展的阶段尝试了不同类型的多元化战略,其结果喜忧参半。趋于金融自由化的今天,资本市场对公司影响深远。中国为了配合一带一路、长江经济带等国家战略,组建了金砖国家银行、亚洲基础设施投资银行。中国公司更多的需要走出