基于场景内与物体语义相关的声音对场景的解码研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zqy61032526
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类主要依赖视觉和听觉感知外部世界,通过整合视听觉刺激,人类能够快速、高效的识别周围的环境和物体。已有研究表明人脑可以表征场景与物体之间的语义关系,现实生活中,除了视觉信息,还存在大量的听觉信息,人脑通过整合视听觉刺激来理解外部世界。然而,现在的计算机模拟人脑对外部世界进行探索和识别面临着很大挑战,尤其是在跨膜态识别场景领域,还没有研究利用机器学习方法分析视觉场景和听觉声音之间的语义关系。功能磁共振成像技术(fMRI)基于血氧水平依赖(BOLD)对比增强原理进行成像,具有空间分辨率高、无侵入性和一定的时间分辨率的特点,非常适用于分析脑活动的时空信息和高级的脑功能连接,广泛应用于临床、认知科研等领域。利用fMRI研究人脑通过声音解码场景的底层机制,有助于人工智能和智能计算机在场景识别领域的发展,引导计算机更加高效的识别复杂场景。本文围绕人脑对场景和场景中的物体的声音的语义关系展开研究,应用fMRI采集被试观看四种场景和聆听八种声音的BOLD信号。用带有支持向量机的多体素模式分析方法(MVPA)评估人脑是否能够基于场景内物体的声音的平均激活模式解码场景的激活模式。结果表明在梭状回后部(pF)、枕部偏侧区域(LO)和颞上回后部(STS)可以通过声音的激活模式来预测场景的激活模式。进一步,我们利用功能连接方法在四个感兴趣区域分析人脑在场景和声音条件下的功能连接情况,结果均发现STS与其他三个脑区没有显著的正相关,因此,我们利用Seed-to-Voxel方法探索两种任务下与STS有显著正连接的脑区,发现处理声音和处理场景的脑网络之间存在差异。随后,我们利用有效连接方法动态因果模型来探索实验任务下的脑区之间的信息流动情况,发现外部场景调节LO和pF之间的信息流动情况。
其他文献
苯乙烯侧链C=C的选择性氧化一直是烯烃环氧化研究领域关注的热点之一。近几十年来,苯乙烯环氧化主要倾向于多相过渡金属催化剂的开发与应用,以铜为主要活性物种的催化剂因具
棉花是世界性纺织物来源的重要经济型作物,而纤维品质的好坏是权衡棉花价值的重要指标。棉纤维的正常发育需要大量的蔗糖供应,而蔗糖转化酶是参与生物体内蔗糖代谢的关键酶之
纵向最低价格约束协议违法性的界限以及相关研究一直是反垄断法理论和实践中的一个难点。理论上的莫衷一是和执法中对协议违法性的含糊态度都说明了纵向价格约束问题是竞争法
为保证高炉生产安全、延长炉役寿命、改进生产工艺,高炉炉底、炉缸监控系统通过近千支热电偶测量炉底、炉缸内部各点温度来监控高炉炉底、炉缸的健康状况。长期以来,这类监控
虽然目前使用的燃料大部分属于化石燃料,但它的不可再生性和对环境的污染迫使我们寻找能够代替它的新能源。氢能源由于具有理想的发热值、燃烧性能好、无毒、减少温室效应等
学位
本文提出了一种适用于越野车辆的胎压监测系统的设计。论文针对越野车辆的特点,对三种主流的胎压监测方案进行了分析并优选了最合适的单项直接式胎压监测。结合某越野车车型,
函数演算是泛函分析中的重要工具.函数演算是一种由若干个算子构造新算子的演算过程.对单个正规算子,我们可以考虑其连续函数演算.实质上,我们是在对一对交换算子A,A*做函数
当前,许多城市正处在发展模式转型的关键时期,城市发展过程中出现的人口老龄化、资源短缺、环境污染等各种问题愈发严重,可持续经济发展面临诸多挑战。创新城区作为城市发展的一种新模式,被视为能有效化解城市问题的重要手段。创新城区的构建与发展,对践行我国可持续发展理念、实现打造创新型国家的战略目标具有重要意义。在此背景下,以创新发展为主线形成了许多不同层次不同功能的城市创新空间主体,创新城区发展模式成为我国
近年来,随着我国经济急速发展,人民生活水平不断提升,体育健身逐渐由“奢侈品”转变为“必需品”。另一方面,国家陆续制定“体育强国”、“全民健身”、“健康中国”等国家战略,进一步促进公民健身意识觉醒,我国群众体育事业迎来快速发展的契机。民间体育社团作为群众体育发展“载体”,已经成为我国城市社区、乡村体育中最常见的群众体育组织形式,并得到迅速崛起。但是我国民间体育社团在现实发展中却出现很多问题,引起社会