【摘 要】
:
在机器学习和模式识别领域中,研究人员常常用样本间距离来衡量样本的相似性。在实际复杂任务场景中,传统的距离度量方式,如欧氏距离、马氏距离、汉明距离等,难以真正表征数据
论文部分内容阅读
在机器学习和模式识别领域中,研究人员常常用样本间距离来衡量样本的相似性。在实际复杂任务场景中,传统的距离度量方式,如欧氏距离、马氏距离、汉明距离等,难以真正表征数据间的相互关系。因此,距离度量学习成为机器学习领域一大活跃的研究课题。距离度量学习从训练数据中自动学习数据间的相关关系,使得数据在新的特征空间中,同类样本分布更加紧凑,不同类样本分布更加松散。在全局度量学习中,度量矩阵可以看做是对数据所做的线性变换。考虑到特征向量表征运动变换的方向,特征值表征对应变化方向上的变化大小。如果现在已经有一个的度量矩阵,微调其各个变换方向上的变换大小,就有可能提高该变换的性能,加强度量矩阵的表达能力。基于这一想法,本论文提出了一种新的基于特征值微调的距离度量学习框架。该框架首先学习得到一个粗略的度量矩阵,然后再通过优化triplet loss来微调特征值,从而提高度量矩阵的性能。最后本论文将该框架应用到全局度量学习、局部度量学习和维度下降等应用场景中,并对其做了理论分析,实验结果表明该方法是确实有效的。此外,本论文根据基于特征值微调的局部度量学习方法提出了基于准线性核的局部度量学习算法。这种算法能利用准线性核,将度量学习问题转化为核支持向量机的分类问题。另一方面,在深度学习领域,为了提升网络性能,网络变得越来越深,网络的计算资源占用和耗时也在不断增加。为了减少计算资源的消耗和加快网络的前向传播速度,网络压缩逐渐成为当前研究领域的热点。为了使网络变得又小又快,研究人员提出了种种优化算法。这些算法能有效缩小、加速模型。但与此同时,变快变小的模型会面临信息丢失从而出现压缩后性能下降的问题。为了尽可能降低压缩对网络性能的影响,老师-学生网络算法逐渐被重新提出。所谓的老师-学生网络算法指的就是让压缩前的网络充当老师,压缩后的网络充当学生。让老师网络指导学生网络学习,提高其泛化能力。现有的老师-学生网络算法大多致力于让学生网络学习出一个老师网络接近的特征空间。然而当老师网络的表达能力远高于学生网络,或者任务数据的分布过于复杂时,学生网络由于本身表达能力有限,难以学到和老师网络相同的特征空间。这种情况下,老师网络对学生网络的帮助就很小,甚至会起误导作用。受度量学习思想的启发,本论文不再关注直接学习相近的特征空间,而是更多的考虑样本间的关系的匹配,从而提出了一种的新的基于度量学习的老师-学生网络算法。这种新的算法致力于保证点与点在一个特征空间中的相对关系,扩大了可行解的空间,从而提升了学生网络的性能。
其他文献
随着我国经济迅猛发展,市场机会逐渐增多,作为我国市场经济中最具有市场活力的市场主体,近年来小微企业表现出其巨大的发展潜力,在实体经济中发挥着重要的作用,填补了部分市场空白,承担了解决就业问题的社会责任,为我国的经济发展贡献了一份必不可少的力量。“融资难”作为企业发展和壮大的瓶颈,在小微企业的发展过程中的绊脚石作用尤为明显,为摆脱这一困境,小微企业往往会采取最直接的方法——向银行寻求融资,但由于其自
城市水生态系统在人类饮水、生活用水、农业灌水、工业用水需求和航运载水的供水中发挥着重要功能,以上突出了河道外用水情况,但是人们往往忽略了河道内水生生物对水量的需求。本研究通过文献调研,总结了国内外近十几年有关生态流量的研究进展,系统总结梳理了四种生态流量核算方法,并将核算方法划分为不同国家、国内又分为不同水体进行总结,提出了目前国内研究存在的不足以及发展趋势;较为详细具体的介绍了生境模拟法理论基础
本文以鲁中H镇“农民上楼”项目为例,引入“多重制度逻辑”分析框架,对从县到村执行链条上不同行动者的行动逻辑和行动策略进行分析,并采用“过程/事件”分析法对项目在A、B
图像分类作为机器学习以及计算机视觉方面基本研究问题,在目前的图像处理等研究领域里逐渐成为了越来越重要的研究方向。在互联网与物联网迅速发展的时代,信息技术的快速发展
近年来,第二语言习得中的语用问题日益受到研究者们的关注,并产生了跨学科的新领域——中介语语用学(Interlanguage Pragmatics),它专门研究学生理解本族语者的言语行为以及学生
贝壳基质蛋白(Shell Matrix Proteins,SMPs)是贝壳形成的主要参与者和功能执行者,在有机框架构建和矿物沉积过发挥重要作用。本课题组前期通过对马氏珠母贝(Pinctada fucata
目的:探讨异种脱细胞猪皮基质敷料(生物敷料Ⅱ型)作为肉芽创面小皮片移植后覆盖物的临床效果。方法:22例肉芽创面植皮患者,肉芽创面总面积为5%8%TBSA,随机分为观察组和对照组。肉芽创面在小皮片移植后应用异种脱细胞猪皮基质敷料覆盖为观察组,以凡士林纱布覆盖为对照组,两组各11例。以视觉模拟评分(Visual Analogue Scale,VAS)作为疼痛评分,比较两组术后第5天换药前后30 min
本文以认知语言学为方法,分别从认知相似性、范畴典型性和分布普遍性三个方面,综合而系统地探究了英语句法结构的语义自然度。 以帮助读者理解和掌握英语句法结构为初衷,文章
英语搭配能力是衡量英语学习者英语水平的一个重要方面。然而,对于中国学习者而言,英语搭配一直是个难点。尤其是动词-名词搭配更成为难以掌握的一个方面。鉴于此,本文对中国
本研究在汉语口语产出准确度和汉语学习自我效能感已有研究成果基础之上,俄罗斯中级汉语学习者为研究对象,对其汉语口语产出的准确度和汉语学习自我效能感情况进行了考察,并