基于数字图像处理的声音导行系统的设计与实现

来源 :东北大学 | 被引量 : 1次 | 上传用户:alan_w76
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
听觉作为人类最重要的感觉器官之一,对视力障碍人士的意义尤为重要。1985年美国加州大学圣巴巴拉分院及卡内基梅隆大学的3位教授一起将声音辅助设备引入到一个为视力障碍人士设计的导行系统之中,从此以声音作为反馈控制模式的导行系统开始了它的发展之路。而数字图像处理技术也从最初的数字压缩应用发展为如今成为社会科学各领域的研究对象,其处理系统从最初单纯的图像到图像的方式发展为多种应用,在医疗应用领域就出现了图像到声音、图像到触觉等多种方式。本论文即关注于将视觉信息转换为声音信号的研究。对经由CCD摄像头采集到的视频信息进行系统的处理,如滤波处理、边缘检测、特征提取、按照像素位置灰度信息映射和边缘形状特征选择的两种模式转换为声音信号,为视觉存在障碍的人士提供帮助。同时,根据图像质量信息分析得出一种逐渐逼近的离焦深度法,控制步进电机带动摄像头自动对焦。主要研究内容如下:(1)根据声音导行系统的结构及性能要求,制定了本论文所研究的声音导行系统总体设计方案及框架图。(2)依据所用摄像头和采集卡的类型,制定出使用Directshow技术进行图像采集以及帧处理。(3)针对现有的以测距反馈为基础的调焦方法和建立在爬山法、Fibonacci搜索法等基础之上的对焦深度法的基础之上,制定出一种逐渐逼近的离焦深度法逐步逼近正焦位置。(4)对图像进行需求检测,参照The vOICe工程设计出改进的图像扫描办法,对一般环境进行扫描和参数映射,并在静止状态下进行目标边缘检测,根据形状矩的特性对三种常见边缘形状进行特定声音映射。(5)成功实现了移动与静止两种模式下的声音映射输出,并实现了粗略的调焦应用。
其他文献
第三代移动通信正在全世界紧密部署,新的技术使它在带宽、传输速率以及QoS方面都有相当显著的优势。WCDMA是3G移动通信系统中最具竞争力的标准.基站是运营商网络部署时使用最
各种信息通信技术的发展,使得信息网络更加全面深入地融合人与人、人与物乃至物与物之间的现实物理空间与抽象信息空间,即泛在网络。泛在网络的感知节点不仅采集信息,并且实
雷达的发明在现代军事上具有划时代的意义。雷达设计的最初目标是进行空中目标探测,后续发展使得雷达可实现对地物进行成像。随着隐身技术的问世,外形隐身技术和材料隐身技术
已有的研究表明,对特定神经肌肉的电刺激是治疗神经疾病的一种有效手段。长期以来,研究人员采用电刺激来帮助截瘫和瘫痪病人恢复肢体功能,帮助重度失聪人士恢复听力,帮助盲人恢复
波达方向(direction of arrival,DOA)估计是阵列信号处理的重要研究内容之一,在雷达、声呐、通信系统、智能家电以及智能会议系统中有着广泛的应用。现有的大多数阵列误差校
随着微电子加工工艺和纳米技术的进步,NEMS得到了快速的发展,人们已经能够比较容易地制造出纳米量级的简单NEMS结构和器件。作为NEMS中的基本结构单元和典型器件,双端固支纳