基于深度学习的密集行人检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mldn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习和计算机技术的不断发展,利用深度学习技术进行行人检测已经成为主流方法,并逐步开始应用于平安城市、智慧交通等领域。然而在密集场景下行人目标存在类内遮挡和大尺寸变化,严重制约了SSD、Faster RCNN等经典深度学习检测方法的精度。为此,本文对基于深度学习的密集行人检测方法进行研究,从多尺度特征融合、多任务检测和渐近定位等方面进行改进,对提高遮挡、尺度变化条件下目标检测的精确性和适应性具有重要意义。本文的工作内容可以归纳为以下几点:第一,提出了一种基于稳定性加权的多尺度特征融合方法(Stability Weightedbased Multi-scale Feature Fusion method,SW-MFF)。对基础网络中不同尺度的五张原始特征图和由最终特征图上采样得到的五张深层特征图进行加权求和,由于后者具有更加抽象稳定的特征表达能力,在融合时提高其所占权重,构造出多尺度卷积特征,再利用其进行目标区域检测。在HUST自制数据集和CUHK公开数据集上进行实验,结果证明,相比于Faster RCNN,该方法在两个数据集上的漏检率分别下降了3.4%和2.6%(FPPI=0.1)。第二,提出了一种目标分类、位置回归和漂移抑制多任务目标检测方法(Object classification,Bounding-box regression,and Drift depression-based Multi Task Detection method,OBD-MTD)。在分类和回归任务之外,针对密集行人目标类内遮挡严重的问题,利用损失函数对预测框与邻近遮挡目标的重叠程度进行建模,通过最小化损失函数达到漂移抑制的目的,并同时应用至检测网络的RPN和RCNN阶段。以SW-MFF作为基准方法进行实验,结果表明,加入多任务检测方法后在HUST和CUHK数据集上的漏检率分别下降了2.3%和1.1%(FPPI=0.1),对于遮挡变化具有更好的精确性和鲁棒性。第三,提出了一种两级RCNN级联的目标渐近定位模型(Cascaded RCNN-based Asymptotic Location Model,CR-ALM)。通过在RPN和RCNN阶段对预测框进行两次修正的基础上,级联第二级RCNN模块,完成对预测框的多次修正,逐步产生更精准定位的预测框集合,据此构造出渐近定位模型。最终将该模型与本文前两种方法集成。以SW-MFF+OBD-MTD作为基准方法进行实验,结果证明,加入渐近定位模型后能够产生更加精确的目标预测框,有效筛除冗余和误检窗口,在HUST和CUHK数据集上的漏检率分别下降了2.2%和1.2%(FPPI=0.1)。
其他文献
随着普适计算和无线通信等技术的不断发展,体域网已广泛应用于体育训练、医疗诊断、社会保障等各个领域。在体域网研究领域中,人体步态识别已经成为一个热点,可以帮助计算机感知人体步态并理解相关含义,进而为游戏娱乐、医疗监测和运动辅助训练等具体的研究课题提供基础服务。目前的人体步态识别方法通常使用加速度计采集加速度数据,并使用滑动窗口技术分割数据,在此基础上从分割好的数据中提取特征以实现步态识别。这些步态识
胫-距-跟融合术是治疗终末期踝关节和距下关节的有效手段。1906年,Lexer首次报道了该术式,之后得到了不断的丰富发展,并在临床上广泛应用。胫-距-跟融合术涉及距下关节和踝关
模型预测控制(Model Predictive Control,简称MPC)较之传统的PID控制,在处理具有复杂约束的系统中表现出其巨大的优势,并在大型过程工业过程的控制中得到广泛应用。MPC是一种
产学研合作活动作为一种连接教育界与产业界的桥梁,在世界各国创新发展中都发挥着很重要的作用。美国是世界上产学研合作人才培养模式发展最早且最为成功的国家之一,研究美国
随着现代信息技术的发展,融合传感器、信息处理和通信网络等各种技术的物联网将感知提升到了新的高度。各种智能化设备,如智能冰箱、智能音箱等渐渐走进千家万户,为人们提供
矩阵分解作为一项基础通用的机器学习技术,在实际的工业生产中具有广泛应用。然而,随着训练数据的增长,大规模的矩阵分解无法在单机节点完成,需要将训练数据分发至多个节点上
竹笛曲《冷月》创作于20世纪80年代,作品根据南宋词人姜白石先生的词作《扬州慢》中“冷月无声”的意境进行创作。作曲家以全新的思维对作品整体音响进行构思,在乐器的使用上面打破了原有的传统组合模式,不管在乐器的编制还有创作手法与传统的写作有着明显的区别。在乐队编制上,乐曲采用全新的扬琴、中胡、大提琴、合成器的音色组合与竹笛音色浑然一体,使作品音响充满想象与回味。在创作上,作曲家运用传统音色与现代技法相
为了满足人们对超高数据传输速率的要求,也为了进一步提高无线通信系统的容量,基于60GHz毫米波频段的WLAN已经成为当前的研究热点。支持毫米波通信的便携设备大多使用电池作为能源,由于毫米波通信使用大量的天线阵列来形成定向波束,所以在毫米波频段下能量的消耗变得比在以往的无线局域网中大得多,而电池的使用时间有限,因此节能控制是一个非常具有现实意义的研究问题。此外,IEEE 802.11ad标准在传统标
公共危机的瞬间爆发常常伴随伪信息的“推波助澜”,伪信息突然的大规模传播,不仅会引起人群的恐慌,其引发的公共危机造成的二次危害更会带来难以估量的损失。伪信息爆发常常没有预兆,在有关机构和群众并未做好准备的前提下,难以形成有效的应对。而引发公共危机的伪信息又常常与群众利益切身相关,更导致了高关注度、更广的传播范围,极易引发危机事件。发现伪信息突然爆发的规律,在引发公共危机前及时作出应对,进行干预,就能
键值数据库以其精简的结构,优异的读写性能,在越来越多的场景中起着关键作用,诸如电子商务、网络游戏、搜索引擎和广告等。键值数据库内部的数据布局有多种实现方案,比如redis、memcache将数据存储在内存中,以哈希表结构进行索引;以及leveldb、cassandra将数据存储在硬盘上,以LSM树结构进行索引。因为现实世界中很多应用,其数据量大于内存容量,持久化的键值存储非常必要,所以针对LSM树