论文部分内容阅读
作为计算机视觉研究领域里最热门和最有前景的识别任务之一,视频中识别人类活动的任务在过去的许多年来引起了研究人员的极大关注。不仅仅是因为这是一个人工视觉系统的基本能力之一,还因为其识别能够帮助建造很多非常重要的应用。动作识别在这些年的研究中有了很多的进展,但也遇到了许多挑战。已有很多的方法尝试解决动作识别中遇到的不同的难题。其中视角不变的动作识别便是其中之一。本文在三视角中通过寻找几何限制来进行视角不变的动作识别。这三个视角包括了两个模板视角和一个测试视角。本文首先证明了当一二视角已经匹配上的时候,三焦距张量落在原来27维空间的一个12维的子空间中,并把这个子空间中的三焦距张量叫做三焦距子张量,并且这个三焦距子张量所代表的三焦距张量满足所有的内部限制。接着本文使用了三焦距子张量限制在三视角中识别动作。本文发现:1)在三视角下识别动作要比在二视角下更加有效;2)仅仅是通过增加另一个模版视角但是仍然在二视角的方法下识别动作并不能获得太多的提高;3)一个比较直接并简单的方法是直接利用三焦距张量来识别动作,但不考虑一二视角的匹配信息并不能有效利用三视角中的限制。最后本文设计了数据库和实验来验证本文中方法的有效性。