基于自监督学习和向量量化技术的fMRI跨模态视觉重建

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:sunna2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深入理解大脑的结构和功能是本世纪最具挑战性的前沿科学问题之一。对人脑的各种功能进行不同尺度和不同层次的深入探索,不仅对诊断和治疗人类的各种疾病有重要的意义,还可以有效促进类脑人工智能和脑机接口技术的发展。尝试利用神经影像数据分析大脑的工作原理及功能的研究被称为神经信息编解码,从大脑的神经响应中解码出人眼看到的视觉信息是“读脑术”的率先尝试。视觉图像刺激会引发大脑视觉脑区的特异性神经活动,通过功能磁共振成像等神经影像方法可以捕捉到这些神经活动。本论文旨在通过最新的机器学习技术,尝试从神经影像数据中更准确地重建人眼观看到的视觉图像,藉此促进类脑智能和脑机接口技术的发展。本文的主要研究内容及贡献概括如下:1.综述神经信息解码领域的研究现状,归纳了神经解码任务中使用的机器学习和深度学习算法,总结了跨模态视觉重建算法的设计思路和发展历程。2.提出了自监督学习引导的跨模态生成模型。由于人脑功能高度复杂,且神经影像数据样本量少、维度高、模态多样、信噪比低,普通的深度神经网络模型很难学习到两个模态间精确的映射关系。我们采用自监督学习的方式,充分利用有限的成对样本来挖掘两个模态数据中丰富的隐含信息,从而有效减少网络的过拟,增加模型的泛化性能,使模型能够学习到两个模态隐空间精确的映射关系。在多个公开数据集上的实验结果表明,该方法能够从大脑响应数据中准确地重建出二值对比图像、手写数字和字母等视觉内容。3.提出了基于向量量化技术的跨模态生成模型。由于自然图像数据中同时包含高层语义信息和底层丰富的纹理、轮廓和色彩等结构信息,很难对自然图像的隐含表征和脑神经活动之间的映射关系进行准确地建模,所以传统的神经影像解码方法多是尝试在简单的字符图像上进行视觉重建。针对以上问题,本文结合向量量化技术的思想,提出基于自监督和向量量化技术的跨模态视觉生成模型。该模型可以提取复杂自然视觉图像的隐表征,并与神经活动的隐表征建立准确的隐射关系。实验结果表明所提出的方法在重建复杂自然图像方面比之前的方法有较明显的效果提升。
其他文献
发声运动控制的性能对声学通讯至关重要。然而,目前对发声控制性能的进化和生态驱动因素尚不清楚。仅在蝙蝠中发现的多普勒频移补偿行为(Doppler shift compensation,DSC)是
随着教育信息化的推进,应用计算机来实现教学科研信息管理已经成为必然的发展需要。现在我们的许多中学教学科研信息仍停留在人工管理的制表单,这样的教学科研信息管理给管理
PPP项目模式自开始流行以来逐步成为各个国家和地区在一些重大项目中所普遍采用的项目运作模式,国内外学者大多对于PPP项目的运营方案进行了不同维度的研究和探讨,少数一部分
随着科学技术的飞速发展,扬声器种类越来越多,应用越来越广泛,人们对扬声器品质的要求也越来越高。根据中华人民共和国国家标准GB/T12060.5–2011《扬声器主要性能测试方法》
外观设计是工业与艺术的融合,当其与特定产品结合并具有新颖性时就符合了专利法保护要件,可以申请获得外观设计专利权。当外观设计中的艺术部分能够满足作品的构成要件时,又
国企的改革是中国经济体制改革的核心环节,作为曾经是国企重要组成部分的纺织企业,在这场改革中经历了漫长而曲折的历程。案例企业GL公司的改革处于上世纪末期的1999年,其时
据中国互联网信息中心(CNNIC)的数据显示,截至2020年3月,我国网民规模为9.04亿,互联网普及率达64.5%。随着网民用户的不断扩张,互联网舆情新闻的传播速率越来越快,传播范围也
汽车制造业是我国经济的重要支柱产业,汽车零部件则是汽车工业中的重要组成部分。随着国内消费升级的趋势上升,汽车产品更新换代的速度会不断加快,中国汽车零部件制造业将会
贵州省黔西南州为了响应国家相关政策,提高干部的能力,每年都会对相关干部进行培训,干部培训是贵州省黔西南州的一项重要的活动,目前贵州省黔西南州干部培训管理缺少专门的管
目的:机体受到社会、心理因素影响及各种内外环境因素刺激时,为适应环境会出现一系列全身性非特异性反应,即应激。长期或严重的应激给身心健康带来巨大的伤害。近年来与应激