一种基于安全帽佩戴检测的图像描述方法研究

来源 :小型微型计算机系统 | 被引量 : 5次 | 上传用户:chaizw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
安全帽佩戴检测与描述是施工图像理解中涉及施工安全的重要内容.本文提出了一种基于改进YOLOv3算法,使用规则和模板相结合的安全帽佩戴图像描述生成方法.首先采集并制作数据集,利用图像增强扩充数据样本;然后以原始YOLOv3为基础,改进多尺度预测结构和初始锚框参数,使用K-means算法进行目标框维度聚类;最后在自制的数据集上进行训练与检测,并根据预定义的规则结合语句模板生成描述语句.实验表明该方法在图像描述评价指标上的得分略有提升,同时经人工测评可知,该方法生成的语句在描述佩戴安全帽的人数方面较为准确
其他文献
不断增长的互联网网页信息和成千上万的用户查询请求给搜索引擎的索引更新和查询访问带来了前所未有的实时性挑战.高效的索引压缩算法能够降低索引数据的存储和传输开销,加快
本文针对实际生产中需要对工件进行自动检测,获取工件质心的问题,采用了边缘检测技术以及最小外接矩形算法对工件定位的方式,采用了BP神经网络完成相机标定.针对基于RCF的边缘检测技术生成边缘粗糙的问题,提出了一种RCF(Richer Convolutional Features for Edge Detection)模型的优化方法,将每个阶段用于提升特征图分辨率的反卷积操作替换成可以生成更精细边缘、时
传统的图像分类问题多使用人工设计的图像特征进行分类,然而部分果蔬图像存在颜色、纹理和形状差异较小的现象,导致传统特征分类效果不够理想.针对这一问题,本文提出一种融合人工特征和深度学习特征的果蔬分类算法.首先使用Inception V3预训练模型提取果蔬图像的卷积神经网络特征;其次提取图像的颜色直方图和SIFT特征,并对SIFT特征进行局部线性编码;接着使用判别相关分析对特征进行降维融合;最后使用S
基于相关滤波的目标跟踪算法已经取得了较好的性能并引起关注.在RGB图像序列的跟踪中,遮挡、背景与前景相似纹理的情况下会出现跟踪失败.本文提出了一种在判别相关滤波框架中融合深度信息的跟踪算法.由深度图分割获得空间可靠性图,根据可靠性图计算约束滤波器,避免传统判别相关滤波的边界效应.在跟踪阶段,通过对通道响应进行可靠性加权求和获得目标位置.通过目标的深度信息估计尺度,根据目标区域的深度分布和相关滤波器
医疗图像辅助诊断是深度学习在智慧医疗领域中的一个重要应用.针对传统图像处理方法中人工提取特征过程复杂度高、测试识别准确度低和泛化能力差等问题,本文利用深度学习方法对乳腺癌病理学图像进行计算机辅助诊断.先对VGG16浅层卷积网络引入冻结层,并训练微调其余部分参数,再对结合迁移学习的Inception-V3和Res Net-V2-152进行整体参数微调,最后将训练好的的三个模型进行融合,以增强最终识别
本文为解决IT系统结构可视化中IT架构不透明,结构关系复杂,IT系统结构实时渲染帧率低等问题,提出了一种面向IT系统结构可视化的实时渲染方法.通过建立IT结构可视化模型,采用端到端的设计理念,从底层IT基础设施至上层系统、业务、应用等逻辑层次的对象、元素、规则和关系以三维可视化形式呈现,使IT内部结构关系清晰可见.采用混合型布局算法,针对IT结构关系的不同特点,适配相应布局算法,从而适应复杂多变的
为了解决不等长时间序列异常检测和电梯故障的早期预测问题,提出一种长短时记忆自动编码器(( long short-term memory networks auto-encoder,LSTM-AE)与多层感知机(multi-la
近年来,利用机器学习技术对跨站脚本攻击(XSS攻击)进行检测成为网络安全研究的热点.由于检测特征多,样本标注有限,机器学习模型的精准训练问题一直是一个难题.贝叶斯网络可以
针对多层极端学习机(hierarchical extreme learning machine,HELM)对大样本数据集学习时容易发生过拟合现象且内存需求巨大的问题,提出一种基于最大相关熵准则的批量编码式
针对近红外图像与人脸库里的可见光图像匹配的异质人脸识别(Heterogeneous face recognition,HFR),以及人脸识别所用到的深度卷积网络参数量和计算量大的问题,提出了用于学习近红外光图像和可见光图像之间跨光谱域不变的特征的轻量级人脸识别算法.首先使用大规模可见光图像数据集和改进的交叉熵损失函数,训练出一个类内紧凑、类间可分的可见光人脸识别模型,然后用改进的近红外光与可见光图