基于深度学习的图像物体检测与分类

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:jonquil1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像物体检测与分类既是计算机视觉领域的基础,同时也是视觉领域的核心内容。图像物体检测与分类与人们生活密切相关。近年来,由于深度学习方法在ImageNet ILSVRC竞赛辉煌的成果,图像物体检测和分类的研究越来越活跃。大数据时代的到来给人工智能的发展提供前所未有的机遇,在这个时代背景下,深度学习在包括图像物体检测等方面取得的突破性进展并非偶然。R-CNN首次提出了被广泛采用的基于深度学习的物体检测流程,并首先采用选择性搜索提出候选区域,利用深度卷积网络从候选区域提取特征,然后利用支持向量机等线性分类器基于特征将区域分为物体和背景。本文通过对R-CNN模型进行改进,实现一个基于深度学习的图像物体检测与分类系统。首先,对于区域检测模块进行改进,在检测窗生成模块使用检测速率更高的Edge Boxes算法代替选择性搜索。其次,我们对R-CNN进行改进,打破传统的分级训练思想,修改了 R-CNN的网络结构,通过端对端的训练方式,提高了目标检测和分类算法在PASCAL VOC数据集的平均准确率(mAP)。此外,我们基于R-CNN改进的目标检测与分类算法减少了训练阶段的缓存空间,提高了空间利用率。最终我们的目标检测与分类算法在PASCAL VOC数据集获得了 56.8的mAP,相比DPM v5模型提升70%,相比R-CNN提升了 10%。此外,以往的研究注重于检测效果和分类效果的提升,侧重于在数据方面的研究。然而,基于卷积神经网络的可视化工作也是十分有必要的。因此,本文在CNN特征提取可视化也做了很多工作。可以发现,随着网络层数的增加,学习到的特征语义越来越抽象,越能从语义上概括图像的特征。
其他文献
【正】 1964年3月27日四川大学历史系考古教研组派童恩正去阿壩藏族自治州理县和汶川调查石棺葬,因发现了石器,于是又增派林向前往,一并调查了有关遗址,前后历时两个月。这次
以5-羟基乙酰丙酸(5-HLA)和D,L-乳酸(DLLA)为原料通过熔融缩聚合成一种新型脂肪族共聚酯——聚(5-羟基乙酰丙酸-co-D,L乳酸)(PHLA—DLLA)。利用凝胶渗透色谱(GPC)、红外分析(FT-IR)和差示量
"三冗"问题指北宋时期出现的"冗官"、"冗兵"、"冗费"的严重社会问题。北宋统治者希望通过增加官员数量,提高官员待遇,扩大军队数量来达到稳固统治的目的,但严重的"三冗"问题
以过二硫酸胺(APS)/四甲基乙二胺(TMEDA)氧化.还原体系为引发体系,通过活性自由基溶液聚合法制备了交联网状聚乙二醇双丙烯酸酯(PEGDA)共聚物水凝胶支架,探讨了APS/MEDA的引发聚合机理
如何从多位投标人中评选出技术实力较强和报价更合理的中标单位,一直是工程招标造价管理人员的研究内容.文章运用工程量清单计价模式的优点,通过对某国有单位的工程招标项目
半组合船用曲轴输出端对端面和外圆跳动以及端面平面度要求较高,因此曲轴输出端法兰的钻孔难度较大,采用现有的加工工艺不能保证其形位公差。提出一种新工艺以解决法兰钻孔后
构建离子液体1-乙基-3-甲基咪唑醋酸盐[EMIM]OAc与纤维素的均相体系,采用酶原位降解法,以3,5-二硝基水杨酸法表征降解效果,考察各因素的影响确定最佳工艺条件:6.6 g 3%(质量分
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
利用聚酚和4-硝基邻苯二甲腈的亲核取代反应,将邻苯二甲腈单元引入到了聚酚中。傅里叶转变红外光谱(FT-IR)证实了其基本的结构单元,凝胶渗透色谱法(GPC)结果显示在聚酚衍生物的合成