基于对象和动作联合建模的图像标注技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wayl1s1s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的普及发展,网络上的图像信息正以指数级的速率增长。因此对海量图像进行有效的管理和检索有着非常重要的现实意义。这些互联网图像一般都有一些描述其语境的伴随文本,因此从图像伴随文本中选择合适的名词-动词去描述图像中的人物和动作成为当前热点研究问题。现有方法通常用图像中人物的外观特征学习得到表示人物和名词或者动作和动词之间概率的生成模型,然后使用这一得到的生成模型对训练集以外图像中人物运动进行识别。但是,这些方法都是单独的关注于对象或者动作的标注,没有考虑对象和动作之间存在的联系。本文提出了基于对象-动作联合建模的方法,用人脸提取的九个不同位置SIFT特征作为人物外观特征,用基于pictorial structure的人体部位概率分布作为动作的姿势特征,联合建立识别模型,实验表明通过联合建模的方法相比单独建模可以有效提高准确率。同时,在动作的识别上,当前的方法忽略了图像中高维特征之间固有存在的组效应,即同构特征之间存在较强关联性而异构特征之间关联性较弱。实际上,不同类型异构特征在图像语义理解过程中具有不同区别性,例如手臂特征对人挥手这一动作最具有区别性。本文提出了通过Group Lasso从高维异构姿势特征中选择最具区别性特征,最终学习得到生成模型的方法以识别图像中人物运动进而对其进行标注。实验结果表明,本文提出的方法对姿态变化较大动作进行识别时取得了更好结果。
其他文献
特征选择是数据挖掘领域中一个重要的研究课题,特征选择可以剔除学习过程中冗余的、无关的和有噪声的特征,从而得到一个维数最少而判别能力更强的信息特征子集。可以有助于提高
Web应用系统以其易于部署和良好的可维护性等特点,以及能够提供丰富的用户界面而变得越来越流行。随着国家和企事业单位信息化建设的高速发展和信息量的快速膨胀,传统模式的Web应用系统越来越显露出许多问题,例如,较低的响应速度和较差的服务性能。一种新的Web开发技术—Ajax正在成为Web应用领域的研究与应用热点。Ajax技术使用异步调用模式对Web页面进行局部刷新,以“按需取数据”的方式向服务器发送和
随着我国城市化进程和城市基础设施建设的加快,如何保障城市排水管网的运行安全是急需解决的问题。建立城市排水管网安全运行动态监测系统是必要的。在山地环境中,有线网络存
网格计算环境日益成为一种不受地域限制的廉价的超级计算环境,它试图聚合分布在世界各地的计算、存储、知识、通信和信息等各类资源,以服务大众为目的,实现资源共享与协同工作。
在各种犯罪活动中文档伪造是一种常见的伪装手段,由于其易于实施而难于分辨,文档伪造的检测技术显得更加重要而迫切,通过对文档中笔迹改动的检测辨别文档真伪是其中重要的手段。
随着技术的发展,新一代测序技术已经兴起并广泛应用,但传统的PCR片段测序仍非常重要。单核苷酸多态性(single nucleotides polymorphism,SNP)和插入/缺失(insert/deletion,In
随着社会的发展,人们对数字信息的需求越来越强烈,信息技术面临着种种挑战,如信息的表示、知识的共享、软件的复用等等。如何对网络上的海量信息组织、管理、维护和复用并为
近年来,嵌入式技术得到飞速发展并且与网络通讯紧密结合。嵌入式系统已广泛应用于消费电子和通信领域:在手持终端设备方面有卫星定位系统、个人数字助理和mp3、mp4播放器等;
遗传算法是一种有效的全局优化搜索算法,具有简单通用、鲁棒性强和可并行处理以及应用范围广等显著特点,在诸多人工智能计算领域获得了广泛的应用,同时取得了大量的研究成果
闪存作为一种新型的固态存储介质,由于具有体积小、重量轻、非易失、高速、高抗震、低功耗等优良特性,近年来已经被广泛应用于各种嵌入式系统和便携式设备。闪存的独特物理特