基于内唇特征提取的唇语识别

被引量 : 3次 | 上传用户:guidahuasheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别技术在实验室条件下逐渐发展和成熟,作为人们交流时的一个重要的辅助信息,唇读技术能在噪声环境下提高语音识别的识别率,在特殊渠道的情报获取方面也有着不可估量的作用。唇读研究的内容涉及模式识别、计算机视觉、图像处理等多个领域,具有广阔的应用前景,由计算机来实现和完成这项技巧,对人机交流技术有着深远的影响。国内唇语研究起步较晚,是一个较新的课题,正引起越来越多的研究人员的关注。本文在广泛阅读国内外有关唇读识别技术的参考文献的基础之上,通过对国内外现有的唇语识别系统中唇定位、唇语特征提取和识别技术的研究探讨和比较分析,设计开发了基于内唇特征提取的唇语识别系统,强调了内唇在唇语识别中的核心作用。唇定位方面,本文提出了一种灰度平均唇定位方法,通过自制的韵母唇构建灰度平均唇模板,在唇读图片上匹配唇区域。该方法简单易行,能快速准确的定位唇位置,正确率高于90%,适合发音种类不多且背景简单的唇读图片。特征提取方面,本文创建了内唇口型模板,且重新定义内唇曲线函数表达式,将内唇的几何和灰度特征作为唇语识别的基本特征。其中,内唇模板是对传统双唇线模板的简化,强调了内唇的核心作用;重新定义的内唇曲线更为敏感,描述能力更强,是对传统双唇线模板的优化。该方法有效提取了唇读的主要特征,降低了计算复杂度的同时具备较高的识别率。唇语识别方面,本文提出了一种特征聚类识别方法,利用聚类算法得到训练图像中内唇的几何和灰度特征聚类中心,用距离函数完成对测试样本的识别。将聚类算法应用于识别也是一次新的尝试,且该方法能够较好实现识别过程。在本文提出的基于内唇特征提取的唇语识别系统中,研究的重点是特征提取中内唇线模型的构建和应用,是一次全新的尝试。本文的实验对象为单纯的视觉信息,集合为单个韵母发音,采用K-means聚类算法,分别运用欧氏距离函数和和范式距离函数准则,进行基于内唇特征提取的识别。实验结果证明该方法降低了计算复杂度具备较高的识别率,新的尝试具可行性。
其他文献
衔接,作为语篇的一个重要组成部分,对语篇连贯起着至关重要的作用,因此也引起许多语言学家的兴趣。随着韩礼德和哈桑于1976年发表了著作《英语的衔接》,衔接一词在篇章语言学
宋代的军与中国行政区划史上其它行政单位不同,是个特例。它出现于唐代,五代成为行政区,宋广泛设立,宋以后则基本消失。本文将分章探讨宋代军的分布在时间上的变化规律、在地
大输液中可见异物智能检测系统以大输液中所含的可见异物为研究对象,实现了可见异物的智能在线检测。本文在分析了大输液中可见异物国内外研究背景的基础上,对整个系统的构架
我国近几年一直在进行基础教育课程改革,高中数学新课程改革尤其受到重视。在这一系列的课程改革中提出了一种新的学习方式——探究式学习。但是在高中由于各方面的因素,大多
摘要:LTG桥是一座大跨径的中承式曲线钢箱梁钢管混凝土拱桥,孔跨布置为(2×30+80+2×30)m。主梁为曲线钢箱梁结构,单箱八室截面,曲线半径400m,每隔2m设置一道横隔板。主拱肋在
从规则和规范的角度出发,教学制度是教学主体在长期教学实践中产生的关于教学行为的规范体系,引导教学主体形成具有某种特色的教学行为方式。《学记》是我国古代最早的一部教
通过水培实验,研究了水稻永绿色(Stay-green rice,SGR)基因超表达和突变对叶片氮碳代谢的影响。结果表明,在正常生长条件下,SGR基因超表达降低了水稻叶片可溶性蛋白、叶绿素
由于人类文明的不断进步以及社会的飞速发展,使得房屋、公路等所需的自然资源日益增多。在人类不断开采这些自然资源的同时,自然环境遭到严重的破坏,如何开发利用一些环保的
精确农业,即采取措施减小差异,优化资源配置,实施处方农作,获得经济和环境的最大收益。农业机器人融合了田间测绘、变量操作和决策支持系统三项关键技术,将在现代农业中担当
后备人才的培养是竞技体育发展的战略问题,只有重视后备人才的梯队建设,一个国家竞技体育的发展才有后劲。一个项目要想保持水平不断提高,必须遵循项目自身的发展规律和人才