论文部分内容阅读
唇读(lip—reading/speech—reading),可以通过观察说话者的口型变化,“读出”或“部分读出”其所说的内容。唇读研究的目的是利用视觉信道信息补充听觉信道信息,提高计算机系统的理解力。唇读技术源于听力弱者或者听力障碍者学习、了解正常人的表达的一种技巧,它亦可用于特定场合的信息获取(如情报等)。如今,该技术被广泛应用于语音识别、身份识别、人机智能接口以及多媒体系统等领域。唇部检测作为唇读系统的首要环节,主要包含两个方面的内容,第一是在说话者环境中检测出脸部的人脸识别技术,第二是在已经识别出的人脸图像基础上的唇部识别技术。由于人脸识别技术已经有比较成熟的检测方法,本文主要研究在人脸彩色图像基础上的唇部检测算法。本文基于人脸的彩色图像,对不同人种的唇色和肤色的R,G,B分布进行了细致研究,提出一种基于唇色肤色色度差异的唇部检测算法。该算法充分利用了R,G,B三个分量的分布关系定位唇部,简单高效,具有较好的鲁棒性,适用于白色人种和黄色人种。本文将该算法与经典的Chromatic Feature Extraction算法和Red Exclusion算法进行比较,实验表明,本文算法在诸多方面有较大的进步。最后本文将所提出的算法用硬件描述语言加以实现,结果表明,新算法在速度,硬件开销上都符合嵌入式系统的应用要求。