论文部分内容阅读
听觉作为人类最重要的感觉器官之一,对视力障碍人士的意义尤为重要。1985年美国加州大学圣巴巴拉分院及卡内基梅隆大学的3位教授一起将声音辅助设备引入到一个为视力障碍人士设计的导行系统之中,从此以声音作为反馈控制模式的导行系统开始了它的发展之路。而数字图像处理技术也从最初的数字压缩应用发展为如今成为社会科学各领域的研究对象,其处理系统从最初单纯的图像到图像的方式发展为多种应用,在医疗应用领域就出现了图像到声音、图像到触觉等多种方式。本论文即关注于将视觉信息转换为声音信号的研究。对经由CCD摄像头采集到的视频信息进行系统的处理,如滤波处理、边缘检测、特征提取、按照像素位置灰度信息映射和边缘形状特征选择的两种模式转换为声音信号,为视觉存在障碍的人士提供帮助。同时,根据图像质量信息分析得出一种逐渐逼近的离焦深度法,控制步进电机带动摄像头自动对焦。主要研究内容如下:(1)根据声音导行系统的结构及性能要求,制定了本论文所研究的声音导行系统总体设计方案及框架图。(2)依据所用摄像头和采集卡的类型,制定出使用Directshow技术进行图像采集以及帧处理。(3)针对现有的以测距反馈为基础的调焦方法和建立在爬山法、Fibonacci搜索法等基础之上的对焦深度法的基础之上,制定出一种逐渐逼近的离焦深度法逐步逼近正焦位置。(4)对图像进行需求检测,参照The vOICe工程设计出改进的图像扫描办法,对一般环境进行扫描和参数映射,并在静止状态下进行目标边缘检测,根据形状矩的特性对三种常见边缘形状进行特定声音映射。(5)成功实现了移动与静止两种模式下的声音映射输出,并实现了粗略的调焦应用。