论文部分内容阅读
对于计算机视觉问题,早在20世纪四五十年代就有两种观念相对,“从局部到整体”和“从整体到局部”。一个是以Marr为主的局部特征决定整体的观点,一个是以格式塔理论为主的视知觉过程是整体优先于局部,而局部决定整体的观点在长达半个世纪的时间里一直占据主导地位,直到陈霖在2003年的视觉认知会议上提出拓扑知觉理论,明确指出“拓扑性质优先于局部特征性质”。本文以知觉理论为基础研究人脑与计算机图像识别的关系,从两个方面进行分析,一个是视知觉理论,另一个是认知生物学。从视知觉理论的角度主要探讨了格式塔理论和陈霖的拓扑知觉理论这两个具有里程碑性质的理论。从认知生物学的角度主要描述了基于对生物神经网络结构的模拟产生的深度学习网络。通过研究人脑结构与认知过程的关系得到人脑结构直接影响视觉认知过程。首先研究人的视觉认知能力发展的过程,得到人类视觉系统的初期的原始的辨别是对颜色区域的辨别,颜色是人类视觉系统能认知的最早特征,同时模糊细节注重整体也是人类视觉系统早期就具有的特性。对“分割物体与背景”这一经典问题上综合格式塔理论和拓扑知觉理论的观点,对“显著性-选择-完形”这一处理视觉问题的思路进行了完善。基于知觉理论和视知觉过程,本文提出了主体轮廓提取的算法。详细描述了算法的理论知识与实现基础,以及整个算法模型。之后对主体轮廓提取算法与GrabCut算法在提取主体区域上进行对比并将算法在猫狗照片分类中的进行实际应用,证明了该算法的可用性。基于AlexNet的深度学习神经网络对猫狗照片进行分类训练与测试,得到通过本文提出的主体轮廓算法对原始图像预处理生成的数据进行学习训练的效果要比直接对原始图像训练的效果好得多。一方面对于小数据的处理有深度学习网络不具有的优势,另一方面提升了识别分类的准确率。