基于人工智能的视觉感知解码理论与方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zhaoqiangwudi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着现代神经影像技术以及人工智能技术的发展,神经科学家们能够借助这些技术来解码大脑,即读取大脑所感知的内容。解码大脑的神经影像技术可以是脑电图(EEG,electroencephalography)、脑磁图(MEG,magnetoencephalography)或功能磁共振成像(f MRI,functional magnetic resonance imaging)等等。在这些影像技术中,f MRI同时具有无创性和高空间分辨率的优势,并且可以定位大脑区域位置,所以它常被用于脑解码研究。虽然近十年来,基于f MRI信号的脑解码技术得到了快速发展,但还存在分类解码准确率较低,重构解码模糊,语言解码研究欠缺等问题。针对这些问题,本文以自然图像作为视觉刺激,使用f MRI技术记录视觉皮层的神经活动,建立视觉刺激与脑功能信号之间的映射模型,分别从分类解码、重构解码和语言解码三个方面进行视觉感知解码的理论与方法研究,主要内容如下:(1)基于递归神经网络的分类解码研究。针对分类准确率较低的问题,该研究提出了一种基于长短时记忆网络(LSTM,long short-term memory networks)的分类解码模型,从视觉神经活动中分类出刺激图像的类别。结果显示,相较于峰值视觉活动,多时间视觉活动的解码准确率更高。该研究证明了基于LSTM的解码模型可以提取多时间视觉活动中的时间信息,从而提高了分类解码的性能。此外,对不同视觉皮层的比较,结果显示高级视觉皮层的分类准确率显著高于低级视觉皮层。该研究验证了高级视觉皮层比低级视觉皮层包含更多的用于分类解码的有效信息。(2)基于渐进增长生成对抗网络的重构解码研究。针对重构图像模糊的问题,该研究提出了一种包括潜特征提取器、潜特征解码器和自然图像生成器的重构框架,从视觉活动中生成高分辨率的自然图像。在重构框架中,潜特征提取器被用于提取图像的潜特征,潜特征解码器被用于从高级视觉皮层的神经活动中预测图像的潜特征,自然图像生成器被用于结合预测的图像潜特征和低级视觉皮层的神经活动从低分辨率开始逐渐生成高分辨率的重构图像。结果显示重构的图像和刺激图像是相似的。研究表明,该重构模型不仅能够从视觉活动中生成高分辨率的图像,还能够使得生成的重构图像保持与刺激图像一致的语义信息。(3)基于相似条件生成对抗网络的重构解码研究。针对样本量不足的问题,该研究提出了一种端到端的重构解码模型,从视觉活动中生成出自然图像。该重构解码模型包括图像特征提取器、大脑特征提取器和条件生成对抗网络。首先,图像特征提取器和大脑特征提取器分别提取自然图像的潜特征和视觉活动的潜特征。然后,该模型通过判断自然图像和视觉活动之间配对与否,构建相似度损失,并将其引入到重构解码模型的总损失中。接下来,视觉活动的潜特征作为条件,被输入到条件生成对抗网络中,来生成出重构的图像。最后,配对与否的策略被用来训练该重构解码模型。结果显示,重构图像与刺激图像之间具有较高的相似度。该研究表明,相似度损失和配对与否的训练策略,能够使重构解码模型学习到携带有效信息的潜特征,从而提升重构解码的性能。(4)基于递归神经网络的语言解码研究。针对语言解码研究欠缺的问题,该研究提出了一种基于LSTM的语言解码模型,从视觉活动中生成语言。该语言解码模型包括图像编码器、f MRI编码器和语言解码器。首先,图像编码器和f MRI编码器分别提取自然图像和视觉活动的潜特征。然后,图像的潜特征和视觉活动的潜特征通过迁移因子进行加权,并将加权项输入到语言解码器,来生成描述自然图像的短语或句子。在训练过程中,图像的潜特征的权重逐渐转移到视觉活动的潜特征上。在测试时,仅仅使用视觉活动的潜特征来生成短语或句子。结果显示,高级视觉皮层比低级视觉皮层获得了更高的语言解码性能。该研究表明,用于生成语言的有效信息主要在高级视觉皮层中。(5)基于Transformer的语言解码研究。针对语言解码准确率低的问题,该研究提出了一种基于Transformer的双通道语言解码模型,再一次从视觉活动生成语言。该语言解码模型包括图像提取器、图像编码器、神经提取器、神经编码器和语言解码器。首先,图像提取器和图像编码器一起来提取自然图像的潜特征。与此同时,神经提取器和神经编码器一起来提取视觉活动的潜特征。然后,两个潜特征之间的相似度被计算来获得相似度损失,并将其添加到语言解码模型的总损失中。最后,自然图像的潜特征和视觉活动的潜特征通过迁移因子进行加权,并将加权项输入到语言解码器中来生成短语或句子。与上一个语言解码研究一样,在训练过程中,图像的潜特征的权重逐渐转移到视觉活动的潜特征上。在测试时,仅仅使用视觉活动的潜特征来生成短语或句子。通过不同训练策略的比较,结果显示渐进迁移的训练策略拥有最高的解码性能。与此同时,对是否引入相似度损失的比较,结果显示相似度损失提升了语言解码的准确率。该研究表明,基于Transformer的双通道语言解码模型,是一种能获得较高语言解码性能的优秀模型。
其他文献
随着无线通信系统不断演进,高速、高可靠性、高集成度、多功能和低成本的无线通信系统的研发需求日益增长。目前低频的微波频谱资源日益紧张,而在微波频谱的高频段,数字通信技术遭遇了成本剧增、整机功耗增加、数模转换性能下降和通信可靠性下降等问题。为此,加拿大蒙特利尔大学的Caloz教授创新性地提出了基于群时延复用的模拟信号处理技术,利用该技术有望发展成为除数字通信以外的一种新通信体制,而该技术的核心就是群时
转接板(Interposer)是三维集成微系统中高密度互联和集成无源元件的载体,是实现三维集成的核心材料,具有摩尔时代硅基板相当的意义。可光刻玻璃作为转接板相对硅和陶瓷具有热膨胀可调、工艺复杂度低等优点而成为研究热点,由于可光刻玻璃的损耗和集成度的问题限制了其应用推广。如何降低可光刻玻璃的损耗(提高微波性能)和减小孔径(提高集成度)是亟需解决的问题。本文针对上述问题开展了研究:选择Li-Al-Si
随着5G、大数据、物联网、人工智能等新信息技术的到来,越来越多的信息通过网络传输与保存。由于非法监控、暴力破解等导致的信息泄露事件频繁发生,信息安全问题得到了政府、企业等机构越来越多的重视。无源光接入网(Passive Optical Network,PON)是通信物理层数据传输重要组成部分,下行信号传输为广播模式,其传输的数据容易遭受非法用户的窃听和攻击。为了提高PON数据传输的安全性,因此基于
数字家电、5G移动通信、物联网、人工智能等新技术的兴起,极大地推动了电子元器件高频化、微型化、集成化及多功能化进程,同时也对微波介质材料提出了更为严格的要求。因此,微波介质材料正向着满足通信系统高集成化、超宽带、超低损耗方向发展。这就需要揭示微波介质材料的介电机理,优化材料的微波介电性能,发现性能调控及内在影响机制,开发出高性能5G通信用微波介质材料,该项研究具有重要的理论和实践意义。本文以中介电
基于教材,整合单元内容开展项目式学习是笔者基于科学探究活动与项目式学习活动两种学习方式的一点思考与尝试。笔者以粤教版《科学》一年级下册第三单元"百变的纸"为例,探讨了整合单元内容的项目式学习课程设计思路及实施方案。从课程实施现状来看,两者结合,打破了知识的局限性,使知识间的联系更为紧密,高质量的驱动性问题推动学生学习真正发生。从学生的学习反馈情况来看,具有真实性的学习任务让他们有更强的代入感,愿意
一直以来,互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)图像传感器相较于电荷耦合元件(Charge Coupled Device,CCD)图像传感器在帧率、功耗、集成度、性价比等方面有明显优势,再加之近年来CMOS图像传感器在工艺、结构设计上的不断改进,使其相较于CCD的传统劣势(读出噪声、暗电流、动态范围、量子效率等)也得到了显著
宽带、高速、高精度模数转换器(Analog-to-Digital Convertor,ADC)在超宽带雷达系统、电子对抗、无线通信和宽带信号实时探测等领域有着极其重要的应用。传统电子ADC的采样速率已有较大的提升,但受集成材料特性的限制,其模拟带宽和时间抖动的性能都接近局限。光学ADC利用光学技术在超高速、超宽带、超低时间抖动方面的优势,有望同时实现高采样速率、大模拟带宽和高量化精度。本文围绕光学
作为现代射频前端系统的重要组成部分,微波无源电路一直是微波技术领域的研究热点。尽管其已经发展了数十年,但随着现代通信系统的不断进步和发展,对宽带带通滤波器、宽带差分功能电路和宽带滤波型移相器等各类宽带无源电路设计技术的需求日益增加。平面/准平面无源电路因其具有结构简单、成本低、加工简单以及易于集成等优点,因此广泛地应用于现代射频前端系统中。本文基于平面/准平面结构,从宽带带通滤波器、基于微带/槽线
作为电子信息系统的基础材料,微波介质陶瓷被广泛应用于物联网、5G通信、雷达探测、汽车电子等领域。伴随着信息量的增长和数据速率的增大,电子设备集成化、高频化、轻薄化的需求日益迫切,适应高集成需求的低温共烧陶瓷(LTCC)技术近年来备受关注。本文以低损耗Li2Mg3BO6(B=Ti,Sn,Zr)体系为研究对象,采用离子取代、非化学计量比等对其微波介电性能进行优化,并基于精修结果及化学键理论分析了结构-
全面性癫痫是一种因大脑双侧半球大量神经元异常同步放电而引起的脑功能性疾病,累及广泛皮层和皮层下区域,但脑区间的交互机制尚不明确。作为一种脑网络疾病,在网络层面开展研究能够更好地揭示癫痫电活动以及认知功能等方面的脑病理机制。多模态脑成像技术为癫痫脑网络多维度特征的刻画提供了重要的支持,利用融合分析手段可以更加全面地对不同尺度下脑网络的交互模式进行探索,以更深入地揭示癫痫的潜在脑网络机制。本论文借助多