协同目标分割与识别的研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yangglan2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
全文阅读
人类能够轻松地完成对视野中目标物体的解析,比如将目标分割出来并进行识别;但对于计算机,图像分割仍是一个具有挑战性的任务。一个重要原因是,计算机视觉模型在进行图像分割时往往只基于底层的图像数据,而很少涉及到有关于待分割目标的具体知识。事实上,无论对人类还是对计算机,目标分割与目标识别这两个任务是密切相关的:对目标的认识和有关目标的知识能够指导分割模型获得更精确的结果;反之,由于没有背景干扰,更精确的分割结果也可以提升目标识别的效果。这两个任务形成了一个“鸡生蛋-蛋生鸡”的问题。在分析了国内外相关研究领域的基础上,本论文重点研究如何在目标分割任务中引入来自目标识别任务的信息,实现两个任务的协同。本文的主要研究内容和贡献在于:
  1.基于对人类视觉认知机制的模仿,我们提出了一个协同目标分割与识别任务框架,其中两个任务相互交流和促进。基于这一框架,我们以变分分割为基础,以玻尔兹曼机(RBM)为核心实现了一个协同任务模型,其中目标被表达为两个方面:形状和外观。形状用于表达目标的整体结构,而外观用于表达形状内的颜色、纹理等信息。RBM的判别功能和生成功能都被应用到协同任务中。前者用于提取目标形状的特征并完成识别任务,后者则将基于特征和识别结果,生成出参考形状来引导分割过程。目标的外观信息用于进一步约束分割结果,使得分割得到的结果与外观知识相契合。
  2.由于RBM的学习和表达能力存在缺陷,我们将协同任务模型拓展到了现代深度学习方法中,用编码器与解码器分别表达判别过程和生成过程,让协同任务模型的构建更加灵活。特别地,我们使用胶囊网络来学习和表达目标先验形状知识。它能够解耦目标与干扰的特征,过滤掉干扰信息,更准确地提取到目标的形状特征。而胶囊神经元独特的设计也保证了提取到的特征中,每一维数据都具有某种特定的含义,因此能进一步增加协同任务的可解释性。
  3.针对变分分割方法表达能力的缺陷,我们使用神经网络替代变分方法来自主学习和估计演化方向并完成分割。与变分方法一样,神经轮廓演化方法也允许引入先验知识来指导和约束轮廓演化,但它更加鲁棒,更能适应不同的初始轮廓,演化效率更高。我们将神经轮廓演化方法集成到基于胶囊网络的协同模型中,增强了协同任务模型对初始值的鲁棒性和执行效率。为了使得识别结果不再过分依赖于目标形状,我们在识别过程中同时使用了图像纹理信息与目标形状信息,进一步提高了协同任务模型的性能和鲁棒性。
其他文献
英语宾语省略是英语语言中的常见现象(如That movie always shocks(people)),历来是语言学家关注的焦点。近年来,认知语言学家把英语宾语省略现象归入到自己研究的范围之内,但英
现阶段C语言程序设计题评分过程中存在着评分工作量大、评分标准受到评分教师主观意识影响严重等问题,大大降低了C语言程序设计题评分期间的客观性及公平性。基于此,本文对程
本文通过论述数字城市系统的基本技术框架及实现的关键技术,指出数字城市建设应在统一的协议下,实现互操作与资源共享及整合,作好规划,解决政策、标准和设计问题,从而积极稳妥地推进数字城市的建设,并提出建设数字城市的若干措施。
目的探索构建经济实用的白色念珠菌性阴道炎动物模型的最佳成模条件。方法采用SPF级昆明雌性小鼠,经不同剂量的苯甲酸雌二醇(E2)处理后,小鼠阴道内注入含不同菌量白色念珠菌悬液
针对基于闪络毁伤机理的反电力系统弹药,探讨了其装填物和毁伤元素:导电液溶胶材料需具备的主要性能,包括导电性能、抗清除性能、闪络性能、贮存性能和高低温性能5个方面;提出
本文介绍的是用爆炸箔起爆器(EFI),又称微型飞片雷管,对低密度猛炸药如PETN的冲击爆轰传递(STD)EFI用200nF的电容器形成,电容器可以充电至3.5kV,这个电压可使铜桥爆炸。金属等离子
Criminals in the US can be given computer-generated“risk scores”that may affect their sentences.But are the secret algorithms~2 behind them really making just
自20世纪80年代以来,科学技术的发展已成为社会进步最主要的推动力量和国家兴衰的决定因素,为了提高经济增长的科技含量,促进科学技术的开发、应用和推广,各国政府纷纷实行了
目的比较商环包皮环切术的内置与外置两种术式治疗儿童包茎的临床疗效。方法将204例3~14岁包茎患儿随机分为内置术式组(104例)和外置术式组(100例),分别行内置商环包皮环切术和外置商环包皮环切术,从手术时间、切口愈合时间、术后并发症、外观满意度等方面进行比较。结果内置术式组的平均手术时间(7.26±1.58)min,平均切口愈合时间(19.4±3.8)d,并发症发生率2.9%,外观满意度97.
“排队问题”是北师大版数学一年级上册的教学难点之一,一年级数学教师要精准把握学生的认知生长点,找到孩子探究“排队问题”的“最近发展区”,精心设计教学预案,让孩子在探究活动中,跳一跳摘到“桃子”吃。下面根据自己的实践经验,谈一谈自己的几点看法。  一、创设直观形象的生活情境,搭建认知桥梁  著名数学家华罗庚曾说过:数与形,本是相倚依,焉能分做两边飞。数缺形时少直觉,形少数时难入微。数形结合百般好,割
期刊