基于迁移学习的一类自然图像分类算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:whansiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,信息的表示形式越来越多样化。作为一种直观明了且易于理解的信息表达形式,图像已成为大数据的重要组成部分,数量急剧增多。比如现在浏览各种网站都会看到大量图片,包含信息丰富,这使得图像在研究和日常生活中日益重要,图像分类技术也随之成为图像处理领域的研究重点。而传统的机器学习方法进行图像分类时,不仅需要大量的标注样本,而且过于严苛的同分布假设也势必会使得分类器性能下降。不过可以庆幸的是,互联网上有许多分布不同的标注信息完整的相关图像集(源域)留存。如何充分且高效地运用这些不同分布的图像集辅助缺乏甚至无标注的目标域图像进行分类是当今机器学习和机器视觉领域的研究热点。这种利用源域的知识帮助目标域解决问题的方式称为迁移学习,是一种新型的机器学习方法。迁移学习不再受同分布假设的制约,能够将不同领域之间稳定不变的结构和特征在相似的领域或任务间进行共享和迁移,在图像分类领域有较高的应用价值。研究基于迁移学习的图像分类是为了将源域的知识更高效地运用到目标域,提高目标域图像的分类准确率。针对自然图像分类问题,本文改进了两种不同的基于迁移学习的图像分类算法。主要内容及创新点描述如下:(1)针对在联合适配边缘和条件分布以缩小源域与目标域的分布差异时存在的由类不平衡问题导致的模型泛化性能差的现象,改进了一种基于平衡概率分布和实例的图像分类方法(Balanced Distribution Adaptation and Instance Based Image Classification Algorithm,简称BDAIIC)。现有的方法大多都是单一地迁移特征或样本实例,BDAIIC算法则是两者的有机结合,在数据特征变换的同时重用与目标域相关性较高的样本实例,进一步提升模型的泛化性能。为了缩小领域间的分布差异,BDAIIC算法对源域与目标域的边缘概率分布和条件概率分布进行了联合适配,并且设置平衡因子量化两个分布的贡献率,采用加权条件分布处理类别分布不平衡问题。在字符和对象识别图像集上设置了多组对比实验进行验证,较大幅度提升的分类结果证明了BDAIIC算法的可行性及优越性。(2)针对当前很多基于迁移学习的图像分类算法大多只考虑缩小领域间差异性而无视数据固有的语义信息以及特征可能会偏移或扭曲等问题,改进了一种基于流行嵌入式分布对齐的图像分类算法(Manifold Embedded Distribution Alignment Based Image Classification Algorithm,简称MEDAIC)。该方法引入测地流形核函数进行特征变换,保持数据几何分布属性,挖掘数据深层语义信息,避免特征偏移或扭曲而造成负迁移。并且在缩小不同领域间的分布差异时,MEDAIC算法通过特征变换学习两个耦合投影,对源域和目标域进行了耦合式概率分布,以同时缩小领域间边缘概率分布和条件概率分布差异。不同图像数据集上的多组实验的分类结果,证明了MEDAIC算法的有效性和适用性。
其他文献
河南小麦播种面积全国第一,粮食播种面积全国第二,小麦的播种面积更是达到全中国的1/4,为国家粮食安全做出突出贡献。兰考县是全国商品粮生产基地县,常年以小麦、玉米为主要
碳排放所造成的环境污染,严重威胁着人类社会和生态环境的可持续发展,实现低碳减排已成为世界各领域的关注主题。其中由农业所产生的碳排放量已占到重要比重,而水稻是中国最
海浪、海流和潮汐是海洋中的海水的重要运动形式。在海洋监测的所有要素中,波浪是最基本最重要也是最复杂的一种运动形式。它在海洋工程建设,航海安全及海洋灾害预警具有十分
尖山矿区赋存条件复杂,为含多条岩石夹层倾斜-急倾斜多矿带的铁矿床,品位低,矿带内矿体与夹层相互呈层状产出,地下开采应用无底柱分段崩落法。在开采过程中,由于夹层剔除困难,放矿控制难,受到顶部覆岩和夹石混入的影响,矿石损失贫化大。目前国内外针对这种含多夹层的矿体,在应用无底柱分段崩落法开采过程中的矿石损失贫化控制还没有找到行之有效的方法。本文以降低尖山矿区多夹层矿体损失贫化为目的,采用物理相似模拟实验
目的通过高分辨率食管测压、24hpH-阻抗监测、SF-36量表及GERDQ调查,分析难治性胃食管反流病(RGERD)的临床特点,探讨体表穴位电刺激治疗RGERD的疗效。方法本研究为随机对照、
动态多目标优化问题(DMOPs)有着冲突的优化目标,而且DMOPs的问题环境会随着时间动态变化,从而导致问题的Pareto最优前沿(PF)和/或Pareto最优集合(PS)发生变化。算法的研究很
物联网作为新一代信息技术的代表掀起了新一轮信息化的浪潮,随着技术的发展以及与各行业的深度融合,产业链上下游企业迎来了全新的发展机遇。在中国,物联网的发展受到了人口
太赫兹时域光谱技术是一种具有高分辨率、相干性、低能量、指纹谱和高信噪比的检测技术,使得该技术在毒品、爆炸物、药品、食品及农产品等物质的定量与定性分析方面得到广泛应用。针对目前在使用太赫兹时域光谱技术对物质进行定性和定量分析中,经常遇到太赫兹时域光谱没有明显的特征谱峰情况,如何对这些光谱进行特征提取及分析。为此,本文围绕太赫兹光谱的特征提取及有效识别分类展开研究,取得以下成果:本文提出了一种基于双向
全钒液流电池(All Vanadium Flow Battery,VRB)是一种高效、清洁的储能系统,具有容量大、功率高、循环寿命长等优点,比较适用于大规模储能,近年来发展比较迅速,已经在美国、
目的:评估苏州大学附属第二医院进行调强放射治疗的宫颈癌患者的治疗疗效和放射毒性反应,并分析疾病预后和毒性反应发生的危险因素。方法和材料:回顾性分析2014年1月至2017年12月在苏州大学附属第二医院进行调强放疗的宫颈癌患者,包括以放射治疗为主和术后辅助性放射治疗。Kaplan-Meier方法用于确定总体存活率和无进展生存率,Cox回归分析用于确定潜在的预后因素。方差分析用于确定毒性反应发生的相关