基于唇部视觉特征的语言识别技术研究

被引量 : 3次 | 上传用户:zhongkelong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的快速发展和各种智能设备的普及,人们对人机交互的需求也越来越多。在所有人机交互方式中,通过语言来进行交互显然是方便和高效的。传统的基于音频的语音识别,在一些环境中识别效果不很理想,因此,本文在单纯依靠唇部视觉特征进行语言识别方面进行了研究。本文的研究内容主要从嘴唇区域分割、视觉特征提取和语言分类实验方面展开。在嘴唇分割方面,通过采集包含有讲话者人脸的图像,应用OpenCV人脸检测技术,对人脸进行了定位,然后对包含有嘴唇区域的图像进行粗分割。之后通过在Lab和HSV颜色空间中进行操作,将嘴唇和周围皮肤像素点分离开来,从而实现嘴唇区域的提取和分割。在嘴唇部位视觉特征提取方面,在嘴唇区域分割的基础上进行嘴唇关键点的提取。由于分割出来的嘴唇区域在嘴角部位的误差往往比较大,因此对嘴角定位算法进行了改进,使嘴角定位更加准确。之后在唇部提取到所有关键点的基础上进行了嘴唇建模,并实现唇部几何特征的提取。唇部像素特征提取采取了分块进行离散余弦变换(DCT)的方法,最后将唇部的几何特征和像素特征进行融合,并通过实验验证了考虑两种特征后的识别准确率要比单独使用几何或者像素特征的识别率有所提高。在得到单幅唇部图像视觉特征的基础上,加入了一阶差分特征,使得人说话时嘴唇的动态信息也被包含进来。最后,在选择分类识别算法方面,由于本文语言样本量较小,所以选取在小样本数据集下可以取得良好分类效果的支持向量机(SVM),通过应用SVM进行了语言分类实验,实验结果表明本文单纯依靠唇部视觉特征进行的语言识别有较好的识别性能,具有一定的研究价值。
其他文献
在综述蜂蜜出口的技术性贸易壁垒的相关理论的前提下,通过对安徽省蜂蜜产品的出口现状的描述,分析了绿色技术壁垒对安徽蜂蜜出口的现实影响,并就政府要进一步加强蜜源植物的
目的:研究地佐辛用于全麻气管插管诱导的可行性,评价其对血流动力学的影响及其麻醉诱导的有效性和安全性。方法:选择ASAⅠ~Ⅱ级行全麻气管插管择期手术的患者90例,随机分为3
土地出让金是国家财政收入的主要来源。如何规范和加强土地出让金的征收、管理和使用工作,查处土地出让金中的违法违纪行为,作为审计部门肩负着重要的责任。在土地出让金审计
目的分析甲钴胺辅助治疗糖尿病周围神经病变的临床效果。方法选取本院2013年5月至2014年5月收治的糖尿病周围神经病变患者60例,将其随机分为2组,即对照组与观察组,分别采用硫
<正> 伤科少林寺派以《内经》经络穴位、气血传输学说为根据,以异远真人提出的“气血以流行为贵”论为基本理论,临床辨证诊断以经络、穴位为主,既重手法,又重内外用药,既重急
<正>十八大以来,习近平总书记多次讲到规矩和政治规矩,频度之高、强度之大都超乎寻常。现阶段,抓规矩的重要性无须再去强调,真正的挑战是如何才能让规矩立得起来。首先,是要
发展湾区经济,是深圳市委市政府审时度势,科学谋划,主动落实国家"一带一路"战略的重大举措。准确把握湾区经济内涵特征和演变规律,对于加快发展世界一流湾区经济,更好服务"一
企业文化是企业经营理念、管理模式、价值取向的集中体现,是企业管理的全新境界。随着竞争的加剧,更多的人认识到企业的竞争不仅仅是产品的竞争、市场的竞争,还有文化的竞争
由于传统的贸易创造理论所隐含的假设前提与中国—东盟自由贸易区的客观现实存在诸多矛盾。因此 ,衡量CAFTA给我国与东盟带来的贸易创造效应 ,有必要根据目前的客观经济条件
<正>我们的传统节日,是中华民族民俗文化世代相传的重要载体。而春节又是最盛大、最隆重、民众参与最广泛的节日。作为反映社会生活的新闻媒体,春节报道无疑是一项重要的宣传