基于信息熵和分类器集成的无监督域适应算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:geng20516136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习、深度学习的发展,使用带标签的数据集进行监督训练可以很好地实现各种不同的任务,在多种应用场景也有不错的效果,但面对海量的缺失有效标注信息的数据,进行数据标注需要耗费大量的人力、物力和时间成本。另一方面,用训练集数据进行训练得到的模型可能出现无法适应现实场景的问题。无监督域适应算法可以在源域与目标域样本特征分布不同但相似的前提下,将源域样本分类模型迁移到目标域,使模型适应目标域数据。本文围绕无监督域适应算法展开,重点研究在目标域样本不含标签的情况下减小源域和目标域之间的距离,获得域共有特征,提高目标域样本的分类准确率。采用对抗学习的方式进行训练成为域适应算法的主流,通过域分类器将源域和目标域的特征分布对齐,减小不同域之间的特征分布差异。但是,现有的域适应方法仅将不同域数据之间的距离缩小,而没有考虑目标域数据分布与决策边界之间的关系,这会降低目标域内不同类别的特征的域内可区分性。针对现有方法的缺点,本文提出新的域适应算法,具体研究工作如下:1.提出基于分类差异与信息熵的域适应算法,采用双分类器的框架结构,利用两个分类器之间的不一致性对齐域间差异,使源域和目标域数据之间的距离减小,同时利用最小化熵的方式降低不确定性,使目标域特征远离决策边界,提高了目标域样本的类间差异,使目标域样本可以更好地分类。在数字、交通标志数据集和Office-31数据集设计并进行四种不同的域适应实验,证明所提出的基于分类差异与信息熵的域适应算法具有较高的稳定性,可以取得较高的域适应准确率,实现较好的域适应效果。2.在本文提出的基于分类差异与信息熵的域适应算法的基础上,根据集成学习理论,提出基于分类器集成的无监督域适应算法。为度量集成分类器的差异损失,本文设计并探讨了三种度量损失的指标:总和差异距离、最小差异距离和平均差异距离,通过理论分析构建特征生成器和多分类器对抗训练框架,详细描述了基于分类器集成的域适应算法的训练流程。同时,本文将多分类器集成算法应用于开集情况下,分析并设计了拒绝识别算法,提出基于分类器集成的开集域适应算法。在数字、交通标志数据集、Vis DA数据集、Office-Home数据集和Office-31数据集设计进行五种不同的域适应实验,实验结果表明,与现有其他域适应算法相比,该算法具有更好的域适应效果。
其他文献
表面等离子体激元是发生在金属和电介质界面上的电子集体振荡现象。由于其具有突破衍射极限、近场增强等特性,被广泛应用到高灵敏度的传感器设计中,在环境监测、生物、食品安全等方面有着广阔的前景。本论文主要研究了表面等离激元生物传感器的制备及其传感特性,以下是本论文的主要研究内容:提出了一种具有平坦传感表面的光栅耦合表面等离子体传感平台。通过市售的光盘中的螺旋光栅,结合聚合物填充和金属膜涂层形成微型传感器,
学位
随着现代微波热疗、近场探测以及能量传输等领域的不断发展,工作于近场环境的阵列天线成为了当下的研究热门。在这些近场应用环境中,天线的近场分布需要根据不同的应用环境进行相应的调控。由于天线在近场区域的辐射特性比较复杂,因此针对近场区域的聚焦和赋形等问题的研究一直是近年来研究的热点。本文将研究最大化两阵列间功率传输效率的方法来解决近场区域的电磁场赋形问题,该方法是在近场的目标区域内放置多个测试接收天线,
学位
自动气象站在测量地面空气相对湿度时一般采用电容式湿度传感器,在低温或高湿等恶劣环境中,湿度传感器易产生较显著的测量误差,已成为制约湿度传感器性能提升的瓶颈问题。为提高湿度测量精度,提出一种综合利用气压控制和传感器加热技术进行误差修正的湿度测量系统。该系统包括四个湿度传感器,四个加热电阻及其测控电路系统,利用不同气压下的测量数据和有理二次高斯回归过程实现误差修正。对阵列式湿度传感器的分布设计和加热电
学位
帕金森病(PD)是一种常见的神经系统变性疾病,其经典症状为震颤和运动迟缓等。医学专家设计统一帕金森评估量表(UPDRS量表)用于评估帕金森病中运动症状,量表第23项表明可以用手指敲击来反映上肢运动症状的信息。但该量表评估病程需要依赖主治医师的主观性和经验,且早期帕金森病患者或帕金森高危人群的运动症状不是十分明显,故需要设计一种可以采集手指敲击运动相关信息的传感器来客观反应上肢精细运动,进而反应相关
学位
对科研进行准确、合理的评价是客观评估科研人员学术贡献的前提,也是促进学术界良性循环与发展的重要保障。通过对科研论文的有效评价一方面可以调动科研人员的科研积极性,另一方面,可以为科研人员提供一定的帮助并为未来的研究趋势提供进一步的指导。因此,设计合理的论文评价方法具有重要意义。其中,通过学术论文的被引用次数判断文章学术贡献是当前最为普遍的学术论文评估方式,不过,学术论文被引用次数这一指标体系忽视了被
学位
随着传感器技术的不断发展,高分辨遥感影像带来了更加丰富的空间细节信息,基于高分辨率遥感影像的建筑物检测在城市规划等领域中发挥着关键作用,同时基于震后遥感影像的倒塌建筑物检测有助于摆脱对震前数据的依赖,对及时开展应急响应具有重要的意义。目前基于高分遥感影像的建筑物检测主要分为城市场景中的建筑物检测与震后场景中的倒塌建筑物检测。前者基于形态学属性剖面的方法通过对建筑物多属性、多尺度的精细刻画,在缺乏海
学位
随着全球气候变化,极端天气事件的频率也随之增加,以足够精细的时空分辨率提供准确的气象预报变得越来越重要。其次,在一些特殊观测地区,基础设施并不完善,导致气象数据难以采集,从而缺少气象预报产品。因此,气象预报的研究有着举足轻重的意义。自神经网络发展以来,它被迅速的应用于各个领域,气象预报也不例外,众多科研家逐渐开始利用人工智能的方法解决气象预报领域中出现的问题。针对广东省降水因素复杂、偏远地区无法获
学位
近年来,随着图形处理器等硬件的更新换代,基于深度学习的图像语义分割方法发展迅速。这些语义分割方法大多基于完全监督标注,其标注的制作成本高昂。语义分割方法与弱监督学习相结合成为新的研究方向。在弱监督标注的选择方面,大多采用基于图像级别标注的类激活映射方法。本文设计相关的优化方法旨在挖掘弱监督标注和网络自身的监督信息,其主要工作可概括为以下两个阶段:第一阶段是基于等变约束的伪标注生成阶段,本文提出一种
学位
大气电场是研究雷暴云形成及发展过程的重要依据,是大气电学领域的基本参数。大气电场仪是监测户外大气电场变化的仪器设备,对雷电灾害预警和放电过程研究具有重要价值。针对传统大气电场仪存在信号调理电路复杂、芯片陈旧等问题,采用新型集成电路设计大气电场仪,并研究大气电场仪的标定和数据修正方法。主要研究内容和结论如下:(1)针对传统大气电场仪信号调理电路输出信号线性度较差、集成度不高等问题,选用新型集成电路改
学位
随着非线性动力学理论的发展,离散混沌动力学迎来了又一个研究热潮。为增强混沌映射在图像加密中的应用效果,常需要获取调控便捷、复杂度高的时间序列。忆阻器特殊非线性反馈容易引发混沌,从而已成为混沌系统构建的重要元素。本文研究具有较高复杂度的超混沌映射的建模,研究其偏置可控与多稳态属性,通过数值分析和硬件实验进一步证明超混沌映射的特殊演变规律,为超混沌映射在图像加密中的应用提供依据。本文的主要工作包括:一
学位