一种具有鉴别性和时间特性的深度行为识别框架

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:imimim2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别融合了图像处理、机器学习、模式识别等许多领域的研究内容,是计算机视觉领域的热点和难点。近年来,越来越多的学者和机构致力于这一领域的研究热潮。随着研究内容的不断深入,研究重点已从简单的动作识别逐渐发展为对复杂行为的分析,理解和识别。然而,复杂行为识别是一项具有挑战性的研究任务,影响因素包括不受约束的复杂环境,背景杂乱和视点变化等。因此,提取有效且具有鉴别性的特征表示对于改善识别性能是非常重要的。本文在对目前的行为识别方法分析总结的基础上,做出了以下贡献:首先,本文提出了一种自适应子行为视频分割方法,它通过计算视频帧的深度特征之间的相似程度,自适应地将一个行为视频分解成几个不同的原子行为段。与等分行为视频相比,该方法没有破坏每个行为特定意图的连贯行为模式,在时间上保护了运动的连续性;然后,本文引入了时间池化方法来聚合每个原子行为段的特征,从而获取原子行为的时间动态;接着,本文构建了多尺度时间演化描述子,通过设计多时间尺度融合目标函数,使得优化求解后得到的视频特征表示能够在不同的时间分辨率上对行为进行更全面和精细的描述。第二,本文构建了交错增强注意力网络。通过引入层次互补注意力子模块和局部增强注意力子模块,获取了更具鉴别性的深度静态描述子。其中,在层次互补注意力子模块中引入了层间正则化约束和层次互补约束,从而自动聚焦于视频帧中和目标相关联的显著性区域;然后,在局部增强注意力子模块中又构建了语义鉴别性约束,对不同通道间的语义依赖建模,以进一步强调出特征中最具代表性的局部位置细节信息,同时抑制无意义的噪声,改善了特征表达能力。第三,本文将多尺度时间演化描述子和鉴别性的深度静态描述子融合,进一步构建了本文的行为识别新框架,它将动态和静态信息整合到一个统一架构中,实现了对行为更加全面和准确的刻画,同时提升了行为识别性能。在UCF101和HMDB51数据库上充分而广泛的实验验证了本文所提出方法的有效性。最后,本文对研究内容进行了进一步地分析与总结,并对未来工作进行了相应的讨论。
其他文献
谓语动词是句子的焦点,是组织句子其它要素的语法单元。识别谓语动词是理解句子的关键。通过谓语动词识别可以解析句子,获取句子的语义信息,抽取的信息可以作为输入信息,提供给机器翻译、文本检索、知识图谱、自动问答等多种应用。通过构建以谓语动词为中心的知识图谱,可以建模事件的动态演化过程,实现事件识别与事件跟踪,具有重要的研究意义。然而,由于中文谓语动词形式多变、结构复杂、使用灵活,加上中文信息处理缺少句子
心肌纤维结构与心脏功能密切相关,研究心肌结构对解释各种心血管疾病的成因和早期诊断具有重要的理论意义和临床价值。磁共振扩散成像技术(d MRI)是目前无损检测心肌纤维组织结构的主要方法,但是该成像技术对心脏跳动信息特别敏感,使采集的磁共振影像存在伪影,同时也无法获得整个心动周期的d MRI图像。此外,由于伦理限制,离体心脏难以获得,所以离体心肌磁共振成像数据亦非常有限。随着大数据和深度学习的出现,利
科研项目与专家匹配自动推荐系统能够根据科研项目主管部门、地方科技服务机构等部门的科研项目信息,匹配推荐相关的科研技术专家。对于这些机构而言,当他们在研究开发过程中遇到技术瓶颈时,可以通过该系统发布相关的科研项目信息,系统能够根据科研项目信息进行匹配,推荐满足需求的技术研究专家,减少这些机构的专家搜索成本,有利于更好地将技术难题与专家智慧进行匹配。首先,基于目前已有的研究成果,提出了针对科研主管部门
句法要素指的是句子中的主语、谓语、宾语、时间等句法成分。句法要素识别可获取句子的语法信息和语义信息,支撑中文分词、知识图谱构建、机器翻译、自动问答等自然语言处理应用。由于中文字符是由表意符号组成的象形文字,字与词之间结构松散、缺少词的形态变化,谓语构词多样性且无法从形态学上区分识别。所以,中文句法解析和中文分词极易出错。加上中文句式表达形式灵活多变,存在宾语前置、倒装句等特殊句式,导致中文句子的结
液滴与固体颗粒的碰撞是自然界和工业应用中的常见现象。典型地,在采用侧壁喷射冷凝液、营造差异化聚合环境以生产高性能产品的“气液法”聚乙烯工艺中,雾化喷射的冷凝液滴与高温聚乙烯颗粒碰撞,形成不同形式的液膜和动态演化行为。例如,碰撞发生时,一部分液滴在颗粒表面扩散,形成液膜包裹颗粒并从外部穿越颗粒,剩余液膜残留在颗粒表面,为液桥的形成提供基础;又或液膜在颗粒表面下降后回弹,重新聚拢形成液滴,并弹飞离开颗
创新对中国经济快速发展的作用越来越大,专利运营又是实现创新的关键。自中国实施知识产权战略以来,高校专利数量的申请和授权增长迅速,但在高校专利运营方面所取得的成绩不
目前,装配式混凝土结构建筑是中国装配式建筑的主要形式,具有成本相对低、适用范围广等优势,未来将继续占据装配式建筑结构的主导地位。预制混凝土布料机作为预制构件生产线上的关键设备,其布料厚度很大程度上影响预制构件的效率。如果混凝土布料厚度不达标,常常会造成预制混凝土密实度不足或强度不够。目前,混凝土厚度大多靠人眼观测,测量效率低,而创新的激光测量只能单点测量、不连续,无法对大面积混凝土厚度进行全方位测
我国汽车行业自上世纪80年代中外合作伊始至今,始终依照传统欧美、日韩汽车行业的成长轨迹逐步发展,每年保持稳定的增长速度形成了合资品牌与国内自主品牌占据汽车市场的局面。然而,自2013年起,受国外造车新势力(如特斯拉)与国内互联网公司模式的启发,一股“互联网+智能汽车”的新兴电动汽车概念,在国内市场逐渐兴起,给整个汽车行业中带来了新的风潮:一方面,这种风潮带来了互联网模式中快速、精准且迎合时代的迭代
铁路运输当前对于我国经济建设也做出了突出的贡献,同时铁路也是展现国家实力的重要形式。当前在铁路维修上常用的机械设备为捣固车,由于长期以来它的工作环境较为恶劣,轴承
随着知识经济的到来,科学知识到技术创新的应用和工业生产的产出一直颇受关注。有效地展现科学-技术-生产力的知识流动,能够帮助研究人员对知识的应用和产出过程有清晰的认识,为相关管理政策的制定和各类资源的合理配置提供科学的依据,具有重要意义和现实价值。专利作为技术创新的载体,是连接科学知识和工业生产力的重要纽带。利用专利对科学文献的引用关系和专利到企业的转让关系来探究知识流动和转化的过程在现有的研究中是