基于图像序列的嘴唇分割算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cph2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,多媒体交互技术越来越得到相关领域研究者的关注。而语音识别技术作为交互技术的核心之一也得到了快速的发展。但是,在噪声和干扰下,语音识别率明显下降,从而使得作为语音识别辅助技术的唇读技术得到了更多的关注。而嘴唇分割是作为唇读技术的第一步至关重要。本文分析了嘴唇分割的相关算法,然后提出了在模糊聚类框架内基于运动信息的嘴唇图像序列分割算法。  基于运动信息的模糊聚类嘴唇图像序列分割算法是在模糊聚类的框架内融入运动信息和参考颜色信息,从而实现对嘴唇图像序列的快速准确分割。通过分析嘴唇图像序列,作者发现两点信息:1)由于嘴唇的运动是连续的,对于那些运动较小或者静止的像素点,它们被分为嘴唇类和非嘴唇类的概率也应与上一帧保持连续性,而运动剧烈的像素点则没有这种连续性。并且,本文选择用Lucas-Kanade算法计算的光流矢量来表示帧间的嘴唇运动信息;2)对于同一个人的嘴唇序列来说,他/她的嘴唇颜色不会发生较大的变化,那么,嘴唇的聚类中心也不会发生较大的移动。因此,可以在目标函数中加入一个参考的颜色信息惩罚项来约束嘴唇聚类中心的变化。  实验结果表明本文提出的嘴唇分割算法在处理嘴唇序列的时候比其它优秀的算法更加的稳定,准确性也更高。并且,在嘴唇分割基础上,本文用一个16点模型来提取嘴唇轮廓。轮廓提取的结果非常的精确,从侧面证明了本文提出的基于运动信息的模糊聚类算法的嘴唇分割效果更好。
其他文献
两相/多相流动体系广泛地存在于自然界和工业过程中,其流动参数的准确测量,一直是工程技术和科学研究领域急需解决而迄今尚未很好解决的研究课题。电阻层析成像(Electrical R
视频运动目标的检测技术是智能视频监控技术研究领域的一项重要内容,其检测性能的好坏直接影响对视频监控系统性能优劣的评估。如何改善视频运动目标的检测性能,已成为改善智能
码率控制在视频编码中起着重要的作用,其目的是在有限的带宽下获得高质量的视频并保证输出视频流的稳定性。分层B帧预测(HBP,Hierarchical BPrediction)结构因为具有较高的编码性
今天互联网已经发展到了大众普遍参与的时代,人们使用网络的方式愈发多样,发布信息也愈发方便,这使得网络中充斥着海量的数据。怎样对这些海量数据进行索引和检索是目前搜索
本文选题来自广西壮族自治区科学技术厅立项的技术开发项目“JT-G型集成化绿色通道专用检查系统”,其目标是研制开发一套基于辐射透射成像原理的集成化、全自动绿色通道检查
OFDM(Orthogonal Frequency Division Multiplexing)正交频分复用技术是一种高速传输技术,它的各子载波相互正交,具有很高的频谱利用率,由于其出色的抗多径和频率选择性衰落