论文部分内容阅读
年龄是人的重要属性。近年来,用户年龄自动估计技术逐渐成为一个涉及模式识别、计算机视觉、语音识别和机器学习等领域的活跃课题。该技术在现实世界中有很多应用,如法医学、电子商务和安全控制等等。日常生活中,人们往往可以很容易的根据多模态信息如人脸图像和语音结合起来估计一个人的年龄,原因在于人脸图像和语音是人的年龄信息的重要载体。同样,人机交互系统可以根据人脸图像以及语音来自动进行年龄估计,并且已经有相关的研究机构和学者分别基于人脸图像以及语音进行了相关的研究,但是据笔者所知,目前的所有自动年龄估计方法都基于单模态信息,如人脸图像或语音。
本文共六章,第一章介绍了自动年龄估计技术的研究背景与研究现状以及存在的问题。第二章分别介绍了人脸特征和语音特征与人年龄之间的关系并分析了利用人脸和语音进行自动年龄估计的可行性。第三章介绍了五种人脸图像的表示模型和各自的优缺点以及现有的基于人脸图像的自动年龄估计算法,并分析了各自的性能。第四章介绍了基于语音的自动年龄估计技术,并分析了与年龄相关的语音特征。第五章中提出将人脸图像与语音结合起来进行自动年龄估计的方法及实验,实验结果表明,多模态年龄估计方法比单模态的年龄估计方法具有更好的性能。第六章总结全文。
本文主要的创新性贡献包括:1.首次将人脸图像和语音结合起来进行年龄估计;2.首次将类别分布学习用于语音年龄估计;3.比较全面的分析了与年龄相关的语音特征。