车载图像行人检测关键技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:suals
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测作为计算机视觉的一个重要研究内容,广泛应用在安防、交通控制、自动驾驶和虚拟现实等领域。近年来,由于视觉处理算法和图形处理硬件的快速迭代更新,行人检测技术也取得了飞速发展,其中基于车载图像的行人检测也取得了不少研究成果和应用。调查发现全世界每年数以百万计的人死于道路交通,众多研究表明基于车载图像的行人检可有效降低交通事故的发生,同时对司机的调研也发现他们对汽车辅助驾驶系统也有较高的接受度。这说明基于汽车辅助驾驶的行人检测的研究有巨大的需求和市场潜力,因此发展行人检测技术已经成为一项重要任务。基于车载图像的行人检测是指在行驶的汽车上,利用各种视觉传感器自行感知周围环境及道路情况,并依据感知信息通过算法进行决策,实时准确地检测出车辆前方的行人及其位置,然后采取适当的预防措施,辅助保障行人以及驾驶员的安全。行人检测和一般的目标检测不同,需要更高的精确度来保证人的安全,同时对检测时间也有比较高的要求,以此来减少交通事故。然而,基于车载图像的行人检测面对的是开放的交通场景,容易受复杂检测背景、行人尺度不均衡、光照变化的影响,这些给图像中行人的定位和分类带来极大的挑战,因此行人检测性能至今仍然没有达到令人满意的效果。本文以面向汽车辅助驾驶的行人为研究对象,以行人检测过程中面对的挑战性的问题展开研究工作,重点解决遇到的复杂检测背景、多尺度和光照不充足等关键问题。本文的主要研究工作和创新如下:1)针对车载图像中行人检测容易受复杂检测背景影响的问题,本文提出基于语义分割的无锚点行人检测算法。该算法由候选区域生成和分类两阶段组成。在候选区域生成阶段:首先设计了一种无锚点(anchor-free)候选区域生成网络,可避免基于锚点(anchor-based)生成候选区域方法中的人工设计超参数问题,同时可减少候选区域的漏检率。其次,提出用图像的语义分割信息来指导和监督行人检测,和无锚点候选区域生成网络共享特征层,提升共享特征图中行人区域特征,降低复杂背景区域的冗余特征。针对可见光行人数据集,提出使用边框级(box-level)语义分割指导行人检测;针对远红外行人数据集,通过传统的阈值分割生成像素级(pixel-level)标签进行语义分割指导行人检测。在分类阶段:提出使用反卷积和上下文信息来提升目标分类网络的判别能力。最后,将本文提出的算法在可见光数据集和远红外数据集上进行实验和对比,结果发现分割能有效抑制复杂的检测背景,降低误检和漏检,同时结合反卷积和上下文信息的分类网络的判别能力也得到了提升。最终检测结果表明本文提出的基于语义分割的无锚点行人检测方法可以有效的抑制行人检测中存在的复杂背景问题,保证行人检测的准确性。2)针对车载图像中行人检测中遇到的行人尺度不均衡问题,本文提出基于尺度自适应特征融合的行人检测算法。首先,设计了一种自适应通道特征融合方法,可根据行人的尺度学习融合权重从而选择不同层次的特征进行融合。然后,以这些融合特征为输入,设计了尺度自适应无锚区域生成网络(Multiple-Scale Anchor-Free,MSAF)用于生成多尺度候选区域。其次,在候选区域分类阶段,设计了一个尺度自适应分类器,通过自学习权重实现对不同尺度的分类子网络加权融合。最后,将提出的检测算法在可见光和远红外数据集上评估,通过实验可知,本文提出行人检测算法不仅可以检测出小尺度行人,同时对尺度较大的行人也有良好的检测效果。总的来说,本文提出的检测方法可以很好的解决多尺度问题,从而提升检测性能。3)针对车载图像中行人检测容易受光照变化的影响的问题,提出基于注意力机制的可见光和远红外相结合的多光谱融合行人检测算法。首先,提出一种基于光照注意力机制的多光谱融合方法MCFF(Multispectral Channel Feature Fusion)来融合不同模态之间的图像特征。然后,在YOLOv5基础上根据多光谱融合起始位置的不同提出多种融合框架来检测行人。用于可见光和远红外相结合的多光谱目标检测,保证在光照条件不足和夜间也可进行检测。在白天光照充足的情况下,可见光传感器采集到的图像信息更丰富,由其发挥主要作用;在夜间或光照不充足情况下,因为远红外感器对光照不敏感,可由其发挥主要作用。最后,在多光谱数据集中验证发现本文提出的检测框架在特征提取的中期阶段融合效果最好,同时不管是在白天还是夜晚单模态行人检测性能都远低于多光谱行人检测性能。所以,本文提出的基于注意力机制的多光谱融合的行人检测在光照不足或夜间也能取得很好的检测效果,可以解决光照不充足和夜间检测的问题。
其他文献
住宅绝非一般意义上的可供居住的房产,其含义应界定为能够满足个人和家庭生存发展的居住条件和环境的总和,是决定人类基本生活福利的具体和持续的要素之一。住宅在人类进化和发展的历史中具有重要地位。在现代社会,人类对于住宅的需求已经不满足于遮风避雨的低层次的生理需要和安全需要。住宅对于个人及其家庭人格自由和尊严的充分实现和发展具有十分重要的意义。住宅问题是指因人的住宅需求无法得到满足而带来的各种社会问题。住
如今,数值仿真成为推动气体放电理论发展的重要手段之一。通过比较数值仿真与实验结果的异同,不断改进数值计算模型,可以逐步建立更接近真实情况的气体放电模型,从而更加深入地详细了解气体间隙放电过程的微观发展变化规律,进一步获得目前通过实验手段难以测得的关键放电参数,推动气体放电理论的发展。近些年,流注放电逐渐成为是气体放电仿真研究的重要内容与切入点,流注放电仿真的关键问题在于求解由粒子输运方程和Pois
研究目的本研究一是利用糖尿病文献大数据,分析国际上中国对世界内分泌与代谢领域的贡献,国内中国大陆、台湾、香港三个主要地区糖尿病研究的发展,展示中国在世界糖尿病研究方面的发展趋势。二是利用真实世界仝小林教授诊疗糖尿病门诊病例的临床大数据,分析仝小林教授态靶结合诊疗2型糖尿病的诊疗模式,挖掘糖尿病各个态势分别对应的证型,各个证型的辨证要点、核心方药,以及指标和症状对应的靶药,从而优化态靶结合诊疗2型糖
目的胃肠积热属阳明病热证范畴,是无形热邪或有形热结壅于胃肠而导致胃肠阳热偏胜的状态,是阳明腑证(即承气汤证)的“证前阶段”。临床观察发现,胃肠积热与小儿呼吸道感染可能存在一定的相关性。肺炎喘嗽是儿科临床的常见病、多发病,有较高致死率。本研究拟系统运用临床流行病学及循证医学相关研究方法探索胃肠积热与小儿肺炎喘嗽的相关性,对小儿肺炎喘嗽、小儿反复呼吸道感染(recurrent respiratory
非线性波导作为片上集成光路中最重要的光学器件之一,得到了人们的广泛研究。与高非线性光纤相比,非线性波导具有体积小、耗能低的优点,它的出现使得传统的非线性光学再次焕发了新的生机。波导能够将光的模场很好地限制在芯区中,从而提高光场强度,使得其在较低的泵浦能量水平下,就可以产生非线性响应。波导的色散对其横截面结构尺寸的变化敏感,可通过改变横截面的结构尺寸对其色散进行调节。得益于CMOS工艺的不断进步,人
事件理解是智能视频监控中的重要研究方向,在安全防范、刑事侦查和城市管理等方面有着广泛的应用前景。传统的监控视频事件理解主要是通过人工查阅的方式,处理速度慢、自动化水平低、成本高,远远无法满足大规模智能视频监控的需求。另一方面,随着人工智能技术的发展,计算机自动化地高效理解视频中发生的事件成为可能。因此,视频监控事件理解技术逐渐成为研究的热点。围绕智能视频监控中的事件理解,本论文从人体动作实时识别、
随着移动互联网和物联网的快速发展,用户设备类型日渐丰富,新型移动应用不断涌现。模式识别、交互式游戏、虚拟/增强现实等计算密集型应用,不仅消耗大量的计算资源和能源,还需要超低的响应时延。然而,用户设备的计算、能量资源受限,不能有效的支撑此类应用。移动云计算允许用户将计算任务卸载至云服务器处理,利用其强大的计算能力弥补自身计算资源的不足。但是,任务的远距离传输导致较高的传输时延和通信能耗。作为改进技术
随着互联网和通信技术的发展,移动通信网络承载的数据量呈指数增长的趋势,导致现有以云为核心的移动网络提供的服务无法满足用户日益增长的服务质量(Quality of Service,QoS)需求。由此,边缘式大数据处理应运而生,其核心思想是将计算能力下放至网络边缘,以减少数据传输至核心网造成的时延及能量消耗。因此,需要在网络边缘侧实现资源的高效管理机制,以服务用户请求。然而,现有基于数学迭代优化的移动
溃疡性结肠炎(UC)是一种慢性、间歇性、反复发作的疾病,难以治愈。目前该病已成为消化系统常见疾病,是慢性腹泻的主因,患者通常需要终身的药物治疗,给个人生活带来不便。已上市的口服结肠靶向制剂及灌肠剂,因个体间差异大,导致靶向不准确,影响药物发挥药效;灌肠剂患者顺应性差。纳米/微粒递药系统可以通过炎症肠粘膜增大的细胞间隙以及炎症部位活跃的免疫吞噬作用,实现药物特异性聚集滞留在炎症结肠粘膜部位持续缓慢释
无线通信转型是第四次工业革命的核心,5G通信技术将工业物联网带入工业4.0时代。随着工业网络场景下数十亿智能设备的部署,设备间海量的数据交换导致无线通信系统频谱短缺问题愈加严重。为实现工业设备间实时、可靠、高效的无线通信,5G开始采用具有丰富频谱资源的非授权毫米波频段进行数据传输。作为高频非授权频段的重要组成部分,非授权60GHz频段因其大带宽、免授权的特性,引起了工业界和学术界的广泛关注。鉴于I