论文部分内容阅读
人类智能具有快速学习和灵活迁移的特点,在应对复杂多变的外部环境时较人工智能系统表现出不可比拟的优势。智能系统运算加工的效率取决于其内部的表征(Marr,1982;Neisser,1967),良好的表征形式正是人类智能拥有该优势的重要原因。现有的视知觉研究大多围绕着“特征”和“客体”等心理表征形式展开(Treisman&Gelade,1980;Kahneman,Treisman&Gibbs,1992)。然而,生活中的现实场景远比“特征”和“客体”复杂得多。视觉系统能够识别场景中的多个对象,理解其中的复杂关系,并提取出视觉场景的语义(Zhu&Mumford,2007)。人类的认知系统如何高效地表征复杂多变的视觉场景是当前认知心理学领域的重要理论问题。由于带有视觉语法的层级结构可通过递归的方式构建出多层次关系,以表示整个场景,且不同的场景信息都可以表达为这一形式,笔者据此认为,场景信息是以视觉语法层级树的形式加以表征的。本论文拟围绕上述假设开展系统研究。本研究针对场景区域分割信息,采用心理物理法与计算建模技术,以层级结构的节点深度效应为指标就场景信息的层级结构表征进行了系统考察。整个研究由两部分组成。研究一主要探讨视觉系统能否对场景中具有复杂空间关系的多个区域构建层级结构表征。该部分研究中,以分割法则为场景区域关系语法规则的层级树,通过层层迭代的方式生成场景分割图,比较层级树中不同深度节点变化条件下的记忆绩效,以检验层级表征存在与否。研究二选取水平和垂直切割规则下的场景区域分割信息,尝试性地就其层级表征的计算过程进行认知建模,并通过比较人和模型在场景分割相关认知任务中的绩效对该模型加以检验。本研究获得以下主要结论:(1)在场景区域分割信息的加工中,层级结构中不同深度节点的属性变化产生了不同的行为绩效,且该绩效差异不能由颜色变化面积等方面的差异所解释。上述结果表明场景信息加工中存在层级表征。(2)在不同结构类型和不同切割规则的场景区域信息加工中,不同节点深度条件的绩效差异均存在。上述结果表明场景信息的层级表征具有普遍性,不仅具有跨层级结构类型的一致性,且具有跨语法规则的一致性。(3)构建了基于贝叶斯推断方法的认知模型。该模型针对场景分割任务输出的结果与人的绩效一致。可以认为,该计算模型良好地仿真了层级表征的构建及其在场景信息相关认知任务中的计算过程。本研究首次针对视觉场景,为发展描述实际执行过程的心理学理论提供了有益的尝试,也为将心理学研究应用于人工智能算法设计提供了示范性的案例。