基于深度学习的交通标志检测

来源 :四川大学 | 被引量 : 0次 | 上传用户:longyouxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通标志检测在辅助驾驶以及无人驾驶领域中都有重要地位。在这一领域,技术方法百花齐放,都是对获得的标志图像进行检测。其中使用深度学习检测算法进行交通标志检测已经成为当下交通标志检测的重点研究领域。在道路交通中,由于复杂的道路交通情况以及驾驶员可能出现的身体不适或者精神不集中等情况,单靠驾驶员用肉眼识别交通标志常常会出现各种各样的问题,所以通过其他方式进行交通标志检测的需要逐渐增大,同时在智能交通和自动驾驶中,交通标志的检测工作是非常重要的,是道路驾驶安全的重要保证。随着卷积神经网络发展的日益成熟,目标检测应用到交通标志检测成为日益兴起的研究领域。由于交通标志检测的对象往往是车载摄像头所拍摄的图片,所以需要选取真实交通情况下的场景图片,并且要考虑到图片在车辆变速行驶时发生的拉伸变形情况。在实际交通标志检测中,由于Faster R-CNN定位精度高但检测速度较慢,适用于在复杂交通场景下低速行驶的情况;YOLOv3算法实时性高,但定位精度较差,适合在高速行驶的情况下进行检测。但由于算法设计人员开始是针对所有类别目标进行检测,所以本文针对这两类不同算法都进行了改进,使其针对交通标志的检测效果更好,从而达到更高的检测精度,本文所进行相关研究内容如下:(1)数据集的制作。本文使用的数据集的主体为中国交通标志检测数据集,选择其中的真实情况图片以及拉伸变形的图片,同时增加带有高斯噪声的图片以及从实验室中取得的车载摄像头拍摄的图片,包括雾天雨天等情况下的交通场景图片,然后统一进行标注,完成交通标志数据集的制作工作。(2)Faster R-CNN算法的改进。由于初始的Faster R-CNN算法针对的检测对象往往为目标体积较大的动物或者人,都是在图片中占比比较大的目标。而本文研究的目标检测对象为交通标志,在很多情况下交通标志在图片中占比比较小,所以本文改进原有RPN网络中的anchor默认值。并且将原有的VGG-16模型改为ResNet101模型,进一步提高对复杂情况下的小目标检测精度,最后进行相关实验比较实验结果,结果表明检测精度得到了一定程度的提升。(3)YOLOv3算法的改进。YOLOv3算法检测速度较Faster R-CNN算法已经有了提升,但是对小目标,还有集群式的小目标的检测效果并不是很好,本文针对交通标志中小目标检测效果进行了改进,通过调整Darknet-53的卷积网络层结构,使得YOLOv3检测部分较小交通标志也有较好的效果,最后进行相关实验,结果表明检测精度得到了一定的提升。
其他文献
乳腺癌是最为常见的癌症之一,早期发现并及时治疗可大幅提高患者存活率。因此,对于乳腺癌的早期诊断十分重要。相较于钼靶、CT等方式,超声检测因其安全性、便捷性、灵活性等优势被广泛应用,针对乳腺超声图像的辅助判别模型也逐渐被重视。不同于海量的人脸、自然图像数据,典型、准确且有效的医学图像金标准数据是极其有限的,同时,罕见疾病数据和新发疫情的早期数据亦是极度缺乏的,此类状况都极大地限制了深度学习等强大模型
甲状腺结节是一种常见的临床问题,对其进行临床检查能够判断患者是否患上甲状腺癌,超声是首选的检查方式,但为了进行更准确的诊断,还需要对患者作病理检查,由此生成的病理报告是公认的金标准。由于病理报告直接反应患者情况,知晓患者的病理报告诊断结论,便可推导出其超声图像检测结果为良性还是恶性。而这对于甲状腺超声图像的标注也具有重要意义:基于超声图像的甲状腺结节计算机辅助诊断系统以深度神经网络作为主要的甲状腺
随着智慧城市的升级,智慧城管系统朝着智能化和多任务的方向发展,其中违规广告牌检测是智慧城管系统的一项重要研究任务。近年来,随着深度学习和计算机视觉的快速发展,越来越多的基于卷积神经网络的目标检测算法被用于非法广告牌检测,具有较高的检测精度,但是在实际应用中可能有一些问题:一方面,对目标检测要求实时性;另一方面,复杂的卷积神经网络的训练需要高性能机器支持,这些高性能的机器不是每个单位都能提供。为了更
随着互联网的蓬勃发展,越来越多网民在社交平台上发表自己的言论,这些言论中通常包含大量的情绪信息,分析这些文本中蕴含的情绪可以为舆情分析等许多任务提供支持,拥有很高的应用价值。由于社交平台上用户发布的每一段文本通常包含多种情绪,且这些情绪间互相存在关联,捕捉这样的关联可以为准确识别文本中的情绪带来帮助,所以文本情绪分析应使用能够建模情绪关联性的多标签分类方法。目前以序列到序列模型为基础的深度学习方法
使计算机具有文本生成能力,是实现人工智能的重要目标之一,也是当前自然语言处理领域的研究热点。近年来,深度学习成为文本生成的主流方法,使得生成文本更加流畅,极大地提高了生成文本的质量。然而,主流的深度学习文本生成方法以序列到序列模型为基础,它们针对相同的源文本总是产生相同的目标文本,这对于要求提供多样性回复的应用场景是不适合的,例如聊天机器人。因此,在满足高质量的前提下提高生成文本的多样性,成为文本
在软件开发流程的前端开发环节中,前端开发人员需要根据UI(User Interface,用户界面)设计图编写对应的界面代码。为了1:1还原UI设计图中UI组件的位置与样式,开发者通常采用一种不断试错的方式进行界面代码编写,这是一项耗时且重复的工作。实现从UI设计图到界面代码的自动转化,可以避免这种重复的试错过程,提高开发效率,有利于软件的快速迭代。近年来,有不少工作利用深度学习技术,致力于将UI设
随着深度学习的发展,中国古典诗歌的自动生成研究取得了很大的进展。近年来,研究人员在关注如何提高自动生成诗歌质量的同时,提出了根据图像信息生成诗歌这一跨模态任务。目前,针对该任务的研究方法仍然存在诗句主题偏移和语义不一致的问题;同时一些重要的图像信息不能准确的被表达在生成的诗歌中;而且在训练过程中,图像和诗歌的配对数据集存在质量差和难以构建的问题。本文针对这些问题,提出了一种基于深度学习的图像生成诗
鞍区的周围毗邻着Willis环、视神经等重要的神经血管结构,是病变的好发部位。颅咽管瘤(Craniopharyngioma,CR)、鞍结节脑膜瘤(Tuberculum Sellar Meningioma,TSM)、Rathke’s囊肿(Rathke’s Cleft Cysts,RCCs)和垂体瘤(Pituitary Adenomas,PAs)是鞍区最为常见的病变。磁共振成像(Magnetic Re
值函数估计在深度强化学习算法中应用广泛,并且在状态和动作空间较复杂的环境中可以解决传统强化学习中遭遇的维度灾难问题。因此,值函数估计的研究在深度强化学习领域具有十分重要的意义。但在深度强化学习算法值函数估计的过程中存在一些问题:(1)在更新值函数的过程中,算法普遍选择当前状态下最大的动作状态值(Q值)估计来计算目标Q值,导致算法过高估计Q值,对性能造成不利影响。(2)基于值函数的深度强化学习算法在
自然语言处理中的信息抽取任务是指抽取自然语言文本中的实体、实体关系和事件等结构化信息,是一种将非结构化或者半结构化的文本数据,转化为结构化信息的技术。随着互联网的飞速发展,网络上存在越来越多的以文本形式存在的数据,如何快速将大量无结构的文本数据转化为有结构的信息,为下游应用提供数据支撑,是信息抽取需要解决的问题。信息抽取的具体任务包括命名实体识别、实体关系抽取和事件抽取。其中,命名实体识别与实体关