基于红外图像的夜间行人检测算法研究与实现

来源 :贵州大学 | 被引量 : 0次 | 上传用户:liongliong511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是模式识别和目标检测的一个具体研究领域,是城市安防和辅助驾驶中重要的研究内容。通常的行人检测任务所面临的场景往往处于良好的可视条件下,而对于可视条件较差(如夜间,沙尘暴天气等)的场景研究较少。因为可视条件较差的场景下,常规相机的成像效果往往也较差。近红外成像的出现在一定程度上提高了成像质量。与可见光成像相比,近红外成像基于物体辐射进行成像,不依赖所处环境的光照条件,在可视条件较差的场景下仍然能够取得良好的成像效果,具有一定的应用前景。本文基于深度学习方法对行人检测技术展开研究,设计红外场景下的行人检测算法并在相关数据集上进验证,取得了良好的效果,主要工作如下:(1)针对夜间场景下的可见光成像较差的场景,使用红外图像进行行人检测。设计了基于YOLOv3的红外行人检测网络IR-YOLO。该网络以YOLOv3为基础网络模型,结合Dense Net网络的密集连接思想,将特征提取网络中不同层的特征图进行拼接,使得每一层特征图含有丰富的低层和高层特征;其次,通过Distance Intersection over Union(DIo U)替换原有损失函数以提高检测时预测框和真实框位置的敏感性。最后,为更好地验证算法的有效性,我们建立了实际场景下的夜间近红外行人检测数据集(NTPD数据集)。实验结果表明,IR-YOLO网络行人检测算法能够有效提高检测精度。(2)针对存在一定可视条件的夜间场景,采用红外-可见光两种模态的数据进行行人检测。设计了基于红外-可见光的跨模态行人检测网络。该网络综合考虑红外图像和可见光图像的图像特征,结合两种图像特征进行行人检测。该网络通过两个不同的卷积神经网络分支分别对红外图像和可见光图像进行特征提取,并在进入全卷积层前,采用中期融合方法对红外图像和可见光图像进行特征融合。而且,考虑到不同模态的特征对最终分类的影响占比不同,引入模态权重子网络对各个分支所占权重进行回归加权。在KAIST跨模态行人数据集的实验证明,该方法在红外图像行人检测中具有良好的检测性能。(3)基于红外图像行人检测和跨模态图像行人检测的算法的研究,设计并实现了红外图像行人检测系统。系统采用B/S架构,利用Django框架和MySQL完成开发。经测试,系统功能完善,运行流畅,交互逻辑易于理解,具有一定的实际应用价值。
其他文献
学位
本研究以优良泡核桃品种‘黔核7号(Qianhe 7)’为对象,研究去皮种仁发育过程中总酚、总黄酮、单体酚含量和酚类代谢关键酶活性的变化规律以及与体外抗氧化活性能力的关系。结果表明:种仁中总酚、总黄酮含量及抗氧化活性在发育过程中均呈上升趋势,于果实成熟期达到最大值,总酚、总黄酮含量分别是为0.05 mg GAE·g-1 FW、0.03 mg RE·g-1 FW,铁离子还原能力(Ferric ion
霍乱毒素B亚基(CTB)是良好的免疫佐剂和载体蛋白。本研究通过定点突变,在CTB基因(ctxB)3′端终止密码前引入了限制性内切酶EcoRI,构建了质粒pMC05。pMC05中CTB与下游lacZ′基因阅读框架相同,转化大肠杆菌后能够表达CTB与β-半乳糖苷酶α肽的融合蛋白;所表达的融合蛋白能与GM1结合,说明融合蛋白保持CTB的基本高级结构和生物学活性;融合蛋白能与抗-CTB抗体结合,说明融合蛋
<正>《回延安》,是贺敬之阔别10年之后回到延安写的抒情诗。诗里有重回延安的激动,有回忆延安往昔的感激,有与延安乡亲团聚的兴奋,有对延安巨变的欣喜,有对延安功绩的歌颂。全诗弥漫着浓浓的情感氛围。教师指导学生解读本文,可从“情”字入手,提高学生读诗技能,明白诗中表达的情感,并受到情感的熏陶。我们可从以下几个方面引领学生走进诗人的情感世界。
期刊
城市滨水地带是城市的特殊地带,这一地带对于城市生态和景观的营造有着极高的价值。芜湖市滨江公园是旧城滨水地带景观营造的典型案例。该文选取芜湖滨江公园一期工程中具有代表性的景观节点,通过SD问卷调查的方式对其进行研究,并将收集的数据进行量化分析,对比样本分析结果,进而对芜湖滨江公园的景观质量进行评价和研究,提出旧城滨水景观营造的对策建议。
四字成语极具中国特色,短小精悍却语意丰富。知网中涉及四字成语口译的文献大都研究四字成语的交替传译。专业译员在交替传译四字成语时会巧妙地选择口译策略,以便目的语听众能够在短时间内很好地理解四字成语。前人的研究都提及了灵活运用四字成语口译策略会提高口译质量,但是没有基于目的论,通过实验法定量分析四字成语口译策略对英文准确性影响的研究。这里的英文准确性指四字成语译文在源语言语境中的意思,在目的语中的语言
口译员角色是口译研究中非常重要的一个主题,其工作场合及翻译内容的多样性,使得他们在口译实践中扮演着各种不同的角色。法庭场合是一种具有特殊型的口译场合,法庭口译译员为了实现交际各方顺利地交流,需要承担的角色也更加具有独特性,但目前针对此领域的研究还比较缺乏。本文以美国社会学家戈夫曼(Erving Goffman)的社会学理论(1981)中的参与框架(participation framework)作
连续纤维增强热塑性复合材料具有优越的机械性能和可设计性,在生产生活中的各个领域的用量逐年增长。机器人3D打印具有成型路径自由度大,改善之间阶梯效应等优势,将其用于连续纤维复合材料的成型,有望实现纤维的Z向排布,改善传统连续纤维3D打印成型件Z向结合力弱的缺陷。针对连续纤维增强复合材料机器人3D打印技术,本文开展了对连续纤维机器人3D打印路径规划方面的研究,设计了适用连续纤维复合材料的混合切片算法,
四字格结构整齐,语义凝练,表意深刻,是出现在对外交流活动中的高频表达方式,然而,在英语中并没有与四字格完全相对应的形式,四字格的英译对口译员提出了极大挑战。而关于四字格的研究又多集中在笔译,所以,本文选择在汉英交替传译范畴中研究四字格的口译方法。本文在目的论指导下,以2016-2021年总理记者招待会外交部译员的译文为研究语料,通过归纳法和案例分析法,在UMEER框架下,从理解、表达、应急三个层面