【摘 要】
:
近年来随着机器学习与计算机视觉的飞速发展,视觉目标识别领域深受国内外研究者的青睐,其中度量学习是实现视觉目标识别的重要途径之一。度量学习的优化目标是根据一定的规则从训练样本中进行训练和学习来获得一个有效的度量,使得不同类别样本特征之间的距离尽可能增大,相同类别样本特征之间的距离尽可能减小。半正定约束度量学习(Positive-semidefinite Constrained Metric Lear
论文部分内容阅读
近年来随着机器学习与计算机视觉的飞速发展,视觉目标识别领域深受国内外研究者的青睐,其中度量学习是实现视觉目标识别的重要途径之一。度量学习的优化目标是根据一定的规则从训练样本中进行训练和学习来获得一个有效的度量,使得不同类别样本特征之间的距离尽可能增大,相同类别样本特征之间的距离尽可能减小。半正定约束度量学习(Positive-semidefinite Constrained Metric Learning,PCML)算法在视觉目标识别领域展现了优越的性能,相比于传统的度量学习算法而言,PCML利用了支持向量机(Support Vector Machines,SVM)的大间隔原理去指导度量矩阵的学习,提高了模型的泛化性能。然而,PCML只简单的考虑不同类别样本特征之间的间隔,忽略了相同类别样本特征之间的数据分布信息。此外,PCML在特征提取阶段采用传统的手工方法进行特征提取,由于手工方法提取到的特征表达能力弱,尤其是在复杂的任务场景中,这些特征往往不能取得令人满意的结果。为了解决以上问题,本论文进行了以下两方面的研究,主要贡献如下:(1)针对PCML忽略了相同类别样本特征之间的数据分布信息,本文提出了一种基于数据结构特征的度量学习(Metric Learning based on Structure Characteristics of Data,MLSCD)算法。MLSCD不仅利用了SVM的大间隔原理,还整合了相同类别样本特征的类内散度矩阵,这样在学习度量矩阵的过程中,不但可以使不同类别样本特征之间的距离不断增加,而且可以使相同类别样本特征之间的距离不断减小。为了进一步提高模型的泛化性能,MLSCD的目标函数中采用了L2-norm而不是L1-norm。(2)针对PCML在特征提取阶段采用的是手工方法进行特征提取,本文提出了一种基于注意力网络和类方差的度量学习(Metric Learning based on Attention Networks and Class Variance,MLBAN)算法。MLBAN使用了融合卷积块注意力机制(Convolutional Block Attention Module,CBAM)的网络进行特征提取,这样提取到的深度特征包含了图像中更多的语义信息,可以进一步提高特征的表达能力。此外,MLBAN将SVM分类器和相同类别样本特征的类内散度矩阵嵌入到了网络结构中,实现了神经网络的端到端训练。为了验证所提算法的有效性,本文在多个识别任务的数据集上进行了综合性的实验分析,实验结果表明,多数情况下本文所提算法比其它算法取得了更优异的性能。
其他文献
高粱是我国重要的杂粮作物,但由于其自身抗营养因子含量高、蛋白质品质不佳、赖氨酸缺乏以及口感粗糙等原因在食用方面仍停留于传统的加工方式。国内对高粱加工品质与应用特性缺乏系统深入的研究,且滞后于国外。高粱不含麸质,是制备无麸质食品的优良原料。近年来,我国因麸质过敏引起的乳糜泻患者不断增加,而目前治疗乳糜泻唯一有效的方式就是严格控制含麸质食品的摄入。当前国外市场上已有较成熟的无麸质食品,而我国对无麸质食
随着智能技术的快速发展,车辆智能化成为目前最热门的研究方向之一。车辆高级辅助系统与车联网的有效结合,能够为驾驶人员提供安全的驾驶环境,减少交通事故的发生概率,从而提高行车安全。其中,车辆前向碰撞预警作为车辆高级辅助系统中的关键技术之一。基于传统视觉的前车碰撞预警方法中,由于存在目标检测精度不高,无法对多目标进行有效测距以及碰撞风险评估策略不准确等问题,导致整个系统预警误差较大,针对上述问题,主要研
中国制造业向着高端化、智能化、信息化不断发展,由于工作环境的错综复杂、人机交互的日益频繁,各式各样的机器人随之出现以适应环境的不同,一类高负载比、小质量、安全性可靠却伴随着精度和抖振问题的柔性关节机械臂受到了广泛的关注。由于执行器不可避免存在输入饱和、死区等非线性特性;同时随着科技的进步,对暂态和稳态控制性能要求日益增高,需要对系统输出进行约束;并且由于柔性的存在,在保证轨迹跟踪的基础上,设计出实
随着我国经济的快速发展,对于汽车的需求不断增加,消费者对于汽车的要求也越来越高,汽车不仅要具备良好的驾驶性能,车身外观也要求具有更好的品质。要获得高质量的车身,就需要具有更高性能的涂装设备。在进行车身涂装时,旋杯静电雾化器喷涂是最为常用的涂装方式,凭借其性能稳定、节能环保、涂覆均匀、对人体伤害小等优点,被广泛的应用于自动化喷涂技术中。大多数的旋杯静电雾化器采用的是气动涡轮来进行驱动的,该涡轮的核心
在如今大数据时代的背景下,各种各样的社交媒体的出现带来了互联网中数据的指数型增长。有了可获得的大量数据,越来越多的研究学者也就根据这些数据进行了大量相关的研究工作,比如社交网络中关键节点的发现研究、社区发现研究、基于文本的推荐算法研究或者情感分析相关研究。本文的研究工作将是对短文本中所包含的情绪进行分析,并且也将文本中出现的非文字信息表情符号纳入情绪分析的过程中。本文的研究工作目的是将根据美国学者
随着人们保健意识的增强,麦冬作为一种传统中药材备受青睐,已被广泛应用于临床配方及中成药原料,出口国外的需求也逐年增加,麦冬的产量问题也越来越被人们所重视。现阶段,麦冬栽植多为人工手动栽植,并没有针对麦冬苗种植相关的机械,因此设计一种能实现麦冬苗机械化栽植的栽植机,具有重要的现实意义。所做主要工作如下:(1)通过对小行距、株距密植技术的思考,以及从多方面设计因素考虑,基于曲柄摇杆式机构作为设计原型,
随着互联网技术的发展,网络社交平台比如:新浪微博,Facebook,知乎等的兴起,越来越多的人都在社交平台上发布消息,表达观点,分享生活,实时参与各种热点话题,接受各种实时新闻。当热点新闻在网络中出现,社交平台中的人逐渐参与进来,转发评论分享,由一小部分人参与到一大部分人,有一个网络社区传到多个网络社区,以此便产生了信息传播。信息具有两面性,当负面信息爆发时,如果不加以控制恐怕会产生巨大的负面影响
膜计算作为自然计算新兴的一支研究领域,其是由生命细胞的结构和功能以及组织、器官、生物神经网络等高级生物组织中细胞群间协作所启发的一种分布式并行计算模型,简称膜系统或P系统。目前,根据膜系统的结构,已将P系统归为三类:细胞型、组织型和神经型P系统。本文所研究的神经型P系统是当前膜计算研究领域的热点。神经型P系统是受生物神经系统所启发提出的一种新型计算模型,其中受生物神经网络中神经元以脉冲的形式处理信
鉴别字典学习(Discriminative Dictionary Learning,DDL)方法自提出以来便在图像识别,目标检测,超分辨率图像重建以及压缩感知等实际任务中取得了优异的表现,并因此成为了计算机视觉和图像处理领域的研究热点之一。支持向量驱动的字典学习(Support Vector Guided Dictionary Learning,SVGDL)方法是一种典型的鉴别字典学习方法。SVG
趋化性是一种由空间中分布不均匀的物质所产生的化学信号刺激细胞或有机体发生定向运动的现象.趋化模型是刻画生物体趋化现象的偏微分方程组,Keller-Segel模型是趋化模型最典型的代表.若考虑细胞自身的繁殖和死亡,在数学模型上体现出来就是logistic增长项的出现.本文考虑以下一类具有logistic增长项的趋化方程组:(?)其中Ω(?)RN(N≥1)是一个具有光滑边界的有界区域,k∈R,μ>0,