标号噪声下图像数据的清洗和特征学习

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:tangjun6422443
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习和深度学习等大数据技术在诸多应用领域中广泛应用的背景下,一个拥有可靠标记的大规模数据集是进行有监督学习任务的基础和必备条件。然而,在实际应用场景中收集到的数据往往存在一定程度的标号噪声现象,即数据的标号被错误地标记。针对计算机视觉领域中图像数据的标号噪声问题,本文对图像数据的清洗和鲁棒的特征学习方法展开研究,具体的工作和创新点如下:(1)详细介绍了标号噪声的相关概念及多种常见的处理技术,并介绍了深度自编码网络和生成对抗网络的基本理论方法,为后续模型框架的设计提供参考。(2)针对传统的标号噪声检测方法导致较高的假阳性率而降低了预测性能,提出了基于异常检测技术和重建误差最小化的数据清洗模型。通过异常检测技术获得候选的标号噪声数据,并根据重建误差最小化准则来进一步选出真正的标号噪声数据。(3)针对因标号噪声的存在影响特征学习过程,提出了鲁棒的类专属自编码网络特征学习框架。具体地,该框架包含三个模块,分别是基于生成对抗网络的数据增广策略、基于重要性加权的优化策略以及基于最小重建误差的重标记迭代策略。通过大量的验证性实验表明三个策略均可以在一定程度上降低标号噪声对特征学习的影响。(4)在MNIST手写数字数据集以及Caltech-10图像数据集中,将所提出的相关模型与最先进的数据清洗模型和标号噪声鲁棒的模型进行对比分析,分别在训练集上的数据清洗任务和测试集上的分类任务验证了所提出模型方法的有效性。
其他文献
在两口4m×2m×1.5m的水泥池中各放入体质量1.4~1.5kg雄尼罗罗非鱼Oreochromis nilotica(XY♂)1尾,体质量0.4~0.6kg奥利亚罗非鱼O.aureus(WZ♀)7尾和4尾,每尾注射0.5个鲤脑垂
某发电公司燃煤机组2×330MW,发电用循环水通过明渠从距厂2km外的循环水泵房取水。2009年,1台6kV循环水泵电源电缆中间头发生爆炸起火事故。
保险作为防范风险的重要手段,担当着经济社会的守护者.保险业的发展与科技进步息息相关,科技创新带来人类文明跨越的同时,也引起风险的异化.新技术诞生不但会改变经济社会的
文章选取湖南省常德市“德国小镇”与大小河街为研究对象,以空间句法为主要研究方法,对两者的空间形态进行整合度、连接值和选择度的对比分析,从空间深层结构的角度来研究商
介绍了某公司钢结构屋面隔汽、保温、防水一体化工程的设计与施工技术,其屋面构造自下而上依次为钢板、自粘卷材、岩棉板、SBS改性沥青防水卷材、带岩片SBS改性沥青防水卷材
本文介绍了中国书法艺术的中华文化思想基础及中国书法的民族文化内涵,阐述了中国书法教育的目的、任务、基本内容,提出研究中国传统文化的基础学科是古汉语,特别是古文字学。古
算起来,自己从事书法的学习已有14年之久了。我于2004年进入鲁迅美术学院攻读书法硕士学位,从那一刻起我便正式开始了书法的学习。
期刊
虚拟现实技术的运用对于旅游管理专业深化实验教学改革,提高实验教学质量具有重要的意义。虚拟现实技术在旅游实验教学中的应用包括构建虚拟知识学习系统、构建虚拟实验教学
歌剧《魔笛》之所以长期屹立在历史的舞台上久演不衰,与作曲家莫扎特运用巧夺天工般的音乐造诣,不断创作出一个个鲜活的人物形象密切相关。而在歌剧众多的人物形象中,帕帕杰
公共文化服务体系建构离不开公共档案馆的参与,公共档案馆对公共文化服务的落实与实施具有重要的支撑作用。本文从公共档案馆参与公共文化服务体系建构的内涵入手,进一步阐述