论文部分内容阅读
视觉语音的研究已经成为人机交互技术中一个非常活跃的领域 ,在语音的相关视觉信息当中 ,最主要的是说话人的口型乃至整个头部的图像 ,即“说话头”(talkinghead)。为了合成具有真实感的三维“说话头”模型 ,提出了一种基于三维模型和真人照片来合成真实“说话头”的方法 ,即在一个中性的三维人头部模型的基础上 ,从任意人的正面和侧面两张照片当中 ,通过提取脸形和五官位置等特征参数来校正模型 ,并且从照片中提取皮肤和头发等纹理 ,使得合成的模型能在较大程度上贴近真人。该方法综合了基于三维模型和基于图像