论文部分内容阅读
视频的理解是一个高层语义信息与底层视觉特征信息自然融合的过程。如何有效地对视频信息进行分析,实现视频内容理解,并根据视频理解所获得的知识进行推理和决策是一个重要的研究课题。本文围绕如何构建一个具备视频信息自动分析与理解能力,并能根据视频中知识进行推理、决策的认知系统展开讨论与研究。我们以中科院计算所史忠植研究员提出的认知体系结构模型CAM[89]为基础,提出了一个面向视频理解的认知模型。该模型通过基于认知的视频事件探测实现对特定视频信息的理解,并根据探测到的事件和过去的决策经验进行认知决策。此外,我们在认知系统中引入了基于自适应关联分类的学习方法。该方法使认知系统可以通过演化式学习方式,不断增强自身的认知知识,提高对于事件的探测能力。最后,我们根据所提出的认知模型构建事件探测主体。该主体可以很好地满足城市应急联动系统中对于事件的自动探测和辅助决策的需求。
本文的主要创新点总结如下:
·提出了基于语义轨迹的事件探测框架。在该框架中,提出了基于语义轨迹的视频信息表征方法,并给出了相应的从底层视觉信息到中层运动物体轨迹信息,再由轨迹信息到高层的语义轨迹信息的语义轨迹生成方法。根据语义轨迹信息提出了基于语义轨迹的事件描述方法。扩展了本体,使其可以支持序列型概念(类)的描述。进一步提出基于正则表达式的语义轨迹类的特征描述方法。最后再通过概念包含推理实现基于语义轨迹的事件探测。
·针对认知模型CAM需要一个基于知识的表示和知识的推理模型,以支持CAM的认知行为,我们提出了一个基于动态描述逻辑的CAM计算模型。该计算模型能在同一个逻辑框架下对静态和动态的知识进行合理表示,并能基于静态、动态知识进行可靠的知识推理。为CAM的智能推理,动作规划,知识存取提供了必要的基础保证。
·情景记忆是认知系统中的一个关键记忆模块。为了在CAM中构建关于情景记忆的信息表示与推理,本文提出了基于cue-mathcing的事件记忆存取机制,认知动机机制,基于历史认知信息的规划机制等认知机制。并提出了相应的基于动态描述逻辑的机制实现算法。
·人在对事物进行认知时,存在一种演化式认知行为,即通过不断总结同类物体信息,发现和提取其公共特征信息,以增强对该类物体的认识。本文提出了一个自适应的频繁关联分类方法。并将该方法与CAM相结合。从而构建了CAM的一种演化式学习机制。该演化式学习机制使CAM认知系统能在认知过程中,不断增加自身知识,提高认知能力。