论文部分内容阅读
提出了一种适用于视听融合的简化型重要性函数粒子滤波器(ISPF),该算法充分利用视听媒体间的天然时空相关性,基于视听信息的融合实现了特定场景中对说话人的跟踪。将声源定位结果转换为一个具有特殊权重的粒子,以图像彩色信息模板匹配算法作为视觉底层跟踪,通过具有特殊权重的粒子来限制和引导视觉跟踪结果。实验结果表明,文中算法与基于单一信息的目标跟踪相比平均误差降低了约三倍,具有明显的优越性。