多视角的唇动身份识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yx_maomao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于多视角的唇动的身份识别技术,是多视角人脸识别和正面唇动身份识别的生物特征识别技术的延伸和组合。说话时的唇动信息,既体现了说话人嘴唇的固有生理特点,也反映了运动变化的个性行为特点,为进行身份识别提供了充分的有用信息。而多视角的唇动身份识别不仅补充了单一视角的缺陷,同时消除了对使用者造成的视角的限制。作为研究的基础,本文首先构建了基于多视角的唇动识别语料库(HIT-AVDB-II),该语料库录制于不同的光照条件下,涵盖多种语言、多种背景等。在嘴唇检测方面,我们针对多视角的特点,采用自适应的颜色空间转换和水平集方法相结合的方法,提高了轮廓获取的准确度。为了解决视频分割不同步的问题,采用了曲线的面积覆盖和的方法,进行唇动曲线同步。在特征提取和模型构建上,首先用DCT和SCHMM相结合的方法。针对图像的嘴唇部分进行DCT变换,采用低频分量构建“eigenlip”,然后使用SCHMM构建说话人模型。实验结果表明直接使用图像表观特征进行身份识别时,图像的信息贡献度随视角的变化而变化。然后使用嘴唇运动轨迹的作为特征,通过嘴唇轮廓的运动曲线和曲线的高阶信息的结合,利用曲线相关度模型,分别针对文本有关和文本无关进行身份识别。最后我们引入了时空体的概念,从时间轴和嘴唇上下运动方向轴获取时空体切片,用直方图提取全局特征,进行直方图特征连接,模型构建采用SVM方法。
其他文献
大量低成本、多功能、微小体积的传感器节点可以分布在一定的区域中形成大规模的、动态拓扑结构的、应用相关的自组织网络。良好的拓扑结构支持传感器网络中的诸多应用,数据
在传统的汽车车身网络中,大量的电子控制单元使得汽车内部导线的数量大大增加由此导致有限的车内空间被繁多的线束占据。随着电子技术的发展,传统式车身通信网络不再适用,汽
面对信息爆炸而产生的海量文本信息,如何更快速、准确地从中获取需要的信息,是人们普遍关注的问题。文本信息抽取的研究工作,便是在这种需求背景下产生的,旨在提供从海量联机
科学技术的日新月异和新军事革命的深入发展,战争的形态正由传统的机械化战争向信息化战争转变。在战争迈向信息化的进程中,信息要素已成为军队战斗力的基本构成要素,将取代物资
当前网络安全正遭受到日益严重的威胁,各种网络安全事件层出不穷。统计发现,攻击者在攻击网络系统时,主要以耗尽对方网络系统的资源为目的,如耗费被攻击者的内存资源、处理器资源
随着Internet的普及和发展,图像数据飞速膨胀,如何高效、快速的检索到所需要的图像数据成为当前图像应用领域的一个研究热点。为了便于图像的检索和识别,基于内容的图像检索
学位
基于内容的图像检索(CBIR)是多媒体信息检索领域的一项新兴技术。与传统利用文本标注的检索方式相比,它具有对图像内容描述充分、客观性强、自动高效等优点,有着极为广阔的应用
随着SOA架构的不断发展和成熟,整个IT业在向其转变。企业通过整合由其他企业提供的服务资源形成新的服务来满足用户不断变化的需求,从而增强市场竞争力。然而,各企业对外提供
判别分析(DiscriminantAnalysis)是模式识别领域的重要研究内容之一。过去几十年来,判别分析在理论和应用上均取得了很大进展。然而,在一些实际应用中,当没有足够多的有标注