改进的SSD算法及其在目标检测中的应用

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户：spsnake

【摘要】

：

针对以R-CNN展开的目标检测速度慢,传统的SSD算法在检测小目标精度不高的问题,提出一种改进的SSD算法。该算法提出轻量级网络融合+层级特征融合构建新的金字塔特征层来解决SSD对小目标识别率低的问题。将卷积前后的特征进行轻量级网络融合,形成新的金字塔特征层,对形成的特征层进行层级特征融合,形成最终的金字塔特征层,在最终的金字塔特征层上执行目标检测任务。在PASCAL-VOC2007的训练集和验证

【作者】

：

张震李孟洲李浩方马军强

【机构】

：

郑州大学电气工程学院

【出处】

：

计算机应用与软件

【发表日期】

：

2021年09期

【关键词】

：

SSD算法特征融合金字塔特征层目标检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于改进YOLOv3的轨道定位点检测技术研究

实时、精确地确定列车在轨道路径上的位置是保障行驶安全、提升运输效率、提供最佳服务的前提。为了解决传统绝对定位技术存在的一些不足,提出一种基于改进YOLOv3的轨道定位点检测方法。根据定位点目标大小,调整网络输入尺寸及其特征提取网络Darknet-53的结构;由于定位点样本数量稀缺,故采用旋转、增噪等手段进行样本扩充,并使用K-means算法对自制的训练集聚类分析;依据官方网络参数说明及实际图片特征

期刊

绝对定位YOLOv3定位点检测样本扩充K-MEANS

倾斜式投影作为前端和模型库分类作为后端的三维模型识别方法

对于模型到模型(shape-to-shape)的识别,已有的多视图方法由于存在信息缺失问题,使得其作为2D卷积神经网络的前端会导致错误的学习,并且使用SVM作为后端会保留这些错误信息,从而增大分类工作的困难。通过改进多视图的投影方法和三维模型分类的方法提高分类精度和效率。使用倾斜式的角度可以最大程度捕捉信息,增大模型与模型之间的特征差异,而模型库分类方法通过建立一个模型库,去除前端学习的错误信息。

期刊

模型库分类倾斜式投影2D卷积神经网络模型到模型识别

基于神经网络与特征融合的胶囊内镜图像识别模型

当前消化道胶囊内镜图像识别算法存在两个局限,一是要对有差别的病灶设计具体的特征检测算法;二是通过深度学习开展迁移学习时,原训练数据与胶囊内镜图像存在较大差异。因此,提出一种小型通用的基于神经网络与特征融合的胶囊内镜图像识别模型。对图像分离G通道、Log变换和直方图均衡化预处理;采用三个相同卷积神经网络分别对三种预处理后的图像提取特征;采用Bagging算法进行特征融合与识别。对Kvasir数据集的

期刊

胶囊内镜图像G通道Log变换直方图均衡化卷积神经网络BAGGING算法特征融合

多智能体同时到达多目标点的协同强化学习算法

针对动态未知环境下多智能体多目标协同问题,为实现在动态未知环境下多个智能体能够同时到达所有目标点,设计函数式奖励函数,对强化学习算法进行改进。智能体与环境交互,不断重复"探索-学习-决策"过程,在与环境的交互中积累经验并优化策略,在未预先分配目标点的情况下,智能体通过协同决策,能够避开环境中的静态障碍物和动态障碍物,同时到达所有目标点。仿真结果表明,该算法相比现有多智能体协同方法的学习速度平均提高

期刊

多智能体多目标同时到达协同避障强化学习

基于深度学习的法律文书事实描述中判决要素抽取

司法判决要素抽取旨在从法律文书的案件事实描述中自动识别出不同的判决特征。目前的研究主要面向自动判决中的词汇特征抽取,缺乏专门针对语句特征的探索。基于此,将判决要素抽取任务形式化为多标签分类模型,提出融合BERT(Bidirectional Encoder Representations from Transformers)和CNN的判决要素抽取方法。同时,为了弱化不同句子的长度差异对模型效果的负面

期刊

智慧司法判决要素法律文书BERT

基于Style-CycleGAN-VC的非平行语料下的语音转换

非平行语料下的语音转换(Voice Conversion, VC)是指在非平行语音数据集的情况下改变源语音特征到目标语音特征的映射技术。由于非平行数据的缺陷,所以当前研究多集中于平行语料下的语音转换,而有关非平行语料的研究提出的模型架构存在局限性,在特定说话人下进行训练得到的模型无法适用于任意说话人下的语音转换,且转化效果有待提高。对此,借鉴两种生成式对抗网络(Generative Adversa

期刊

语音转换非平行语料生成式对抗网络Style-CycleGAN-VC语音合成

基于改进的多模态神经网络图像描述方法

图像描述是一项融合了自然语言处理和计算机视觉的综合任务,现有方法不仅存在描述性能不佳、缺失语义信息等问题,还存在模型结构与图像特征之间语义信息关联性不足的问题。针对这些问题,提出一种使用门控循环单元和卷积注意力模块进行优化的基于多模态神经网络的图像描述方法。为了验证方法的有效性,在MSCOCO2014数据集上进行实验对比,结果表明,改进方法在各项评价标准下的性能均优于原方法和其他经典算法,并且能够

期刊

图像描述多模态门控循环单元注意力机制神经网络

基于特征金字塔网络的图像关键点检测算法研究

传统的图像关键点检测算法大都基于人工设计,不能适应场景变换,泛化性能较差。对此提出一种基于特征金字塔网络的图像关键点检测算法,通过融合网络中多尺度特征使得检测出的关键点具备尺度不变性,能够提取可重复的、鲁棒的关键点。为了提高算法的性能,并提出一种有效的方法产生训练数据集,训练数据集包括室内和室外的各种复杂场景。在多个公开数据集上对该算法进行测试,并与其他关键点检测算法进行对比,实验结果表明,该算法

期刊

图像关键点检测特征金字塔网络可重复性深度学习

基于时空相关性多任务神经网络的交通预测

传统的交通量预测多利用单点附近的交通流信息,未能拓展至区域网络。针对这种情况,提出一种基于时空相关性的高速路网短时交通量预测模型。模型利用实际路网的静态与动态数据计算路段间的等效距离,通过高斯加权函数选择最近邻。将相关路段的交通量预测作为目标预测的额外任务,通过构建多任务循环神经网络(MTL-RNN)模型实现目标路段交通量的协同预测。实验结果表明,MTL-RNN模型在路网交通量预测中的平均预测误差

期刊

交通量预测时空相关性高斯加权函数循环神经网络多任务学习

基于数据分组到达时间的无线ad hoc拥塞避免算法

提出一种新型基于通信数据分组到达时间的拥塞避免算法,以数据分组的到达时间差异来判断网络带宽的拥塞情况,为发送端速率控制提供拥塞控制的依据。在模型控制中建立VTP虚拟传输协议,实现拥塞避免和实时传输协议之间解耦合。该算法通过对拥塞控制建模和优化,较好地解决了针对ad hoc网络的实时流媒体传输的带宽适应性难题。

期刊

无线自组织网络拥塞控制虚拟传输协议流媒体

改进的SSD算法及其在目标检测中的应用

与本文相关的学术论文