基于卷积神经网络的导盲场景语义解释技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:isgongping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据世界卫生组织2017年的统计数据,全球盲人数量高达3600万。盲人难以辨别周围场景及场景中的障碍物目标,内心对未知场景的恐惧导致他们很少出行。目前,大多数导盲设备只能检测障碍物的距离,无法获取周围场景信息。如果把场景语义解释技术融入到导盲设备中,就能够更好地辅助盲人出行。本文的导盲场景语义解释技术以场景图像为输入,场景语义信息为输出,研究的是图像为何种场景;场景中的目标属于何种类别,处于什么方位,距盲人多远距离。近几年来,随着深度学习的相对成熟,图像处理技术飞速提升,使用卷积神经网络来提取场景语义信息是场景语义解释技术的发展趋势。本文将导盲场景语义解释技术划分为场景识别和目标检测及测距两个模块。其中,场景识别模块通过迁移学习方法实现场景类别的识别;目标检测及测距模块通过目标检测算法提取目标的类别和方位信息,通过双目测距技术提取目标的距离信息。本文具体研究内容如下:(1)针对场景识别问题,本文自制了导盲场景数据集,为避免数据样本不足导致训练时产生过拟合问题,采用迁移学习的方法进行训练。首先应用导盲场景数据集,在VGG19、Inception V3和Res Net50三种预训练的卷积神经网络模型上,以冻结全部卷积层,只训练顶层的方式进行迁移学习;随后在Res Net50上探索冻结网络的深度对识别结果的影响。最后通过实验验证了迁移学习在场景识别任务上的优越性。(2)针对目标检测问题,采用轻量化的卷积神经网络Mobile Net作为前端的基础网络,搭建轻量化的目标检测网络MSSD(Mobile Net-Single Shot Multibox Detector)。MSSD利用卷积神经网络提取图像特征,通过多尺度特征图预测,完成目标种类的预测和位置的回归。在MSSD网络上对自制的导盲目标检测数据集进行训练。将训练好的模型在真实场景下进行定性分析,模型的检测速度和准确度均能满足要求。(3)针对目标测距问题,首先完成了双目相机的标定和双目立体校正工作,并对BM、SGBM和GC三种立体匹配算法的性能进行分析,最终选择SGBM匹配算法来生成视差图。针对目标之间的遮挡问题,提出一种基于灰度值排序的目标测距策略。将目标检测结果与双目视差图相结合后,应用该策略可获取较精确的目标距离信息。(4)设计了一套可实现导盲场景语义解释的系统。利用双目相机采集静态图像或动态视频,通过计算机处理完成场景语义信息的提取,将获取的语义信息以语音输出的方式反馈给盲人。对多个真实场景进行测试,从测试结果得出,本系统基本满足了设定的功能需求。
其他文献
子杠坪铅锌矿床位于鲜水河断裂带与甘孜-理塘缝合带之间,地处松潘-甘孜造山带东南缘。本文通过对子杠坪铅锌矿床的矿床地质、矿相学、地球化学和硫同位素研究,对成矿物质来源、流体来源以及成矿过程与作用等进行讨论分析,最终对矿床成因及成矿模式进行了初步探讨。矿体呈似层状、透镜状等分布于上二叠统大石包组含石榴斜长黑云石英片岩与含石榴石钠长云母片岩夹石英片岩之间的层间带中。矿石矿物以磁黄铁矿、闪锌矿、方铅矿及少
随着互联网技术的高速发展,无线通讯技术与智能手机的普及,“互联网+”理念逐渐对各行各业产生不同程度的影响。基于“互联网+”理念衍生出的新的商业模式“互联网+医疗”、“互联网+交通”等逐渐渗透到人们的日常生活中,改变着人们的消费行为。网约车作为“互联网+出行”的典型代表解决了交通行业困扰已久的“打车难”的问题,极大地方便了人们的出行。但在网约车行业高速发展的同时,也暴露出了网约车服务质量参差不齐,缺
在现代人工智能化的社会,图像已经发展成为不可或缺的信息传播载体,然而在其采集、传输或者存储过程中,总是易受到噪声的干扰,使得图像产生一定程度的失真,进而影响图像的后续处理工作。因此,根据图像退化产生的原因,在可用的设备处理功率和可用时间范围内,有效去除图像的噪声在图像处理领域具有重要的理论应用价值。对于一些内部纹理特征及边缘角点信息的保护,如果偏微分方程法仅靠梯度算子来扩散可能会事倍功半;变换域去
CeO_2是重要的稀土材料之一,储量丰富,被广泛应用于三元催化和选择性氧化等多相催化反应中。在实际的应用中单纯的Ce O_2催化性能往往难以满足实际的需求,所以对Ce O_2进行改性是提高其催化活性重要手段之一。(1)探究不同形貌CeO_2的性能:合成五种不同形貌的CeO_2,分别为纳米粒子状(NP)、棒状(NR)、立方体状(NC)、八面体状(NO)和大尺寸片状(NF),并通过三种不同的方法测试其
随着监控设备布控在世界的大街小巷,昼夜不停地监控拍摄以及数据存储技术不断提升,大数据视频资源的时代已然开启。视频智能检索技术也在各行各业中得到广泛的应用。大量监控
城市森林在改善生态环境、维护城市生态系统稳定、促进城市可持续发展等方面起着重要作用,是解决城市环境问题的有效途径。高校校园一般占地面积大,建设年代久远,立地条件较
胶粉改性沥青技术在经济、环保方面有着巨大的优势,但废胎胶粉引入后对储存稳定性及施工和易性的不利影响,始终是阻碍橡胶沥青发展推广的两大障碍。为了解决这两个问题,首先
人工智能技术的出现,革新了传统产业的商业模式和业务流程,能为新的智慧经济时代的产业布局发挥更大的作用和力量。当前国内各大互联网公司也纷纷投入大量人力、财力进行人工
在通信企业改革的步伐中,中国联通、中国电信、中国移动联合腾讯、阿里、京东等互联网公司推出的基于4G网络的互联网套餐以免流量、低价格、多特权的卖点深受用户的青睐。为提高互联网套餐用户使用感知、提高互联网套餐用户发展量、提高公司收入,A公司建设了互联网套餐短信营销项目。该建设项目存在众多不足之处,比如,发送触点营销短信只针对互联网套餐用户激活、流量不足及欠费这三种场景,不包含语音包用尽、体验到期、优惠
目的:利用二代转录本测序技术检测胰腺癌亲代细胞系SW1990及吉西他滨抗性细胞系SW1990/GZ的lncRNA(long non-coding RNA,长链非编码RNA)与mRNA表达谱变化,初步筛选出与化疗抗