基于上下文的移动多媒体信息标注和管理及关键技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:westy116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机通信和多媒体压缩技术的飞速发展以及存储成本的不断下降,尤其是智能手机的流行和各种社交网站的出现,视频、图片等视觉数据的规模呈现爆炸性增长,如何有效的管理和获取这些数据成为一个亟待解决的问题。为了利用文本管理和检索技术实现对这些数据的直接访问,视频和图片的语义标注技术逐渐发展起来,而由于人工标注效率低,成本高,主观性强,目前常用的解决方案是利用计算机对视觉数据进行自动标注。基于语义概念的自动标注是目前常用的标注技术之一,虽然取得了一定的成功,但仍旧存在一些问题影响了自动标注技术的进一步发展,其中包括对训练数据的依赖和视觉语义的局限性等。本文试图从一个新的角度来对待和处理视觉数据的自动标注问题。从本质上讲,视频和图片等视觉数据是视觉传感器对现实世界的实体和事件的描述载体,数据标注试图在视觉描述的基础上实现对原始语义的解析并以语言描述的形式进行还原,以方便组织和管理。视觉传感器是将其功能范围内目标的视觉表现进行记录,而大量与目标语义相关的上下文信息被忽略掉。目前该领域的研究重点仍是如何充分挖掘视觉数据包含的语义信息,与此不同,本文将注意力放在视觉数据的产生过程。随着物联网技术的发展,各种可穿戴感知设备逐渐普及,本文旨在利用可穿戴感器实现对视觉目标相关的上下文信息进行收集和利用,以帮助视觉数据的语义解析,主要研究成果如下:·常规视频中人脸检测和跟踪技术需要处理视频中的每一帧图像,本文提出了一种快速人脸检测和跟踪算法,通过利用传感器收集的上下文信息过滤大量无脸视频帧,从而降低处理时间,减少人脸误报和漏报,提高了人脸检测和跟踪的性能和效率。·在利用传感器进行快速人脸识别的基础上,通过深入挖掘不同感知模式中目标身体运动方向的一致性,提出了一种视频中正面脸部图像识别的方法。与前述的身份识别类似,可穿戴传感器引入使识别过程摆脱了对样本数据的依赖,实验证明,该方法具有更好的鲁棒性。·传统的视频中目标身份识别方法为了保证准确性,需要针对每个目标收集大量高质量的样本数据。本文提出了一种基于运动匹配的身份识别方法,该方法利用同一目标在不同感知模型中运动特征的内在一致性,通过引入可穿戴传感器来协助解决视频中的目标身份识别问题,该方法避开了传统的处理流程,摆脱了对样本数据的依赖,具有逻辑简单,计算复杂度低,可靠性高的特点。·提出了一种视频自动标注方法,该方法分别利用两种不同种类的感知数据进行动作识别,并且通过融合不同感知模式下的判定结果,揭示了目标的身份,最终达到以时间、地点、人物、动作的形式对视频内容进行标注的目的。
其他文献
多属性综合评价是管理科学领域的一个重要分支,其本质是为人们面对复杂问题时提供了一种科学的判断选择过程,包括评价目的的确定、评价指标的构建及预处理、指标权重的确定、
<正>1病例简介患者,男性,6岁,因"发现颈部淋巴结肿大伴压痛半天"就诊于当地医院,门诊B超检查示:"双侧颈部淋巴结肿大",诊断为"颈部淋巴结肿大查因",于2010-06-05入住当地医院
医疗档案是医院档案的重要组成部分,内容包括医疗保健、医疗纠纷等,医疗档案管理的水平高低直接衡量医院水平的高低,对提高医院的知名度,提高经济效益有非常重要的作用。
2l世纪是信息大爆炸时代,各种先进的计算机信息技术不断涌现,随着计算机信息技术的不断发展以及普及应用,社会生产及人们日常生活、工作对计算机的需求依赖程度越来越高,掌握基本
档案编研作为档案工作中非常重要的工作内容,是指利用特定的编研手段将分散在各个档案中的信息进行系统的集中,再以系统化的方式传递给利用者。档案编研是档案部门主动、广泛、
企业档案是指在生产经营和管理活动中形成的对国家、社会和企业有保存价值的各种形式的文件材料。它是企业赖以生存和发展的基本条件,是企业活动须臾不可或缺的重要资源,是企业
党的十九大提出要突出颠覆性技术创新。颠覆性技术的成长比其他新技术的成长更为艰难,需要及早的识别与选择后进行培育。技术选择是难题也是前提,通过分析颠覆性创新技术产生
目的探讨直肠癌组织中Cyclin E、P27kipl和Ki67的表达及病理意义。方法选取2010年1月至2016年2月直肠癌患者肿瘤组织及其同一患者癌旁3 cm以上癌旁黏膜组织标本70例,免疫组织