基于内容相似性的海量音视频数据检索研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:ebayka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了作者在基于内容相似性的海量音视频数据检索方面进行的研究工作。笔者按照查询数据与目标文件相似性程度的不同,将研究分为三个子课题:基于底层音视觉相同的数据检索、基于中层音视觉的检索以及基于高层语义的视觉检索。作者在每个子课题内,找到目前仍然存在的研究难点、改进现有的方法、并对克服难题做出了自己的贡献。底层音视觉检索方面,作者探索了目前少有研究者探索的无监督重复性音视频序列检索。在研究过程中,作者实现了一套无监督视频宏分割系统。中层视音觉方面,作者基于观察,加入多尺度信息并引入条件信息熵的特征选择算法改进了现有的音频声纹特征;同时,在基于传统的尺度不变性局部特征(Scale Invariance Feature Transform)和词袋模型(Bag-Of-Word)的基础上,作者提出了一个层次空间校验机制,过滤误匹配样例、提高检索准确度;再者,在音视频方面的研究积累的基础上,作者开发了一套音视频拷贝检测系统,并参加了TRECVID拷贝检测竞赛。高层语义检索方面,作者尝试克服目前研究领域存在的一个难题:“语义鸿沟”。本人利用人机交互的机制,基于随机游走算法,试着在底层视觉相似度和语义相似度之间建立连接;同时,作者也参加了TRECVID Instance Search竞赛单元,提交了交互式检索系统。最后,作者针对这三个子课题,收集了测试数据,进行充分实验。实验表明,在底层、中层音视觉检索方面,本人的改进工作、实现的系统均取得了令人满意的成果。高层语义方面,我引入的交互式检索方法的性能优于自动式检索;然而,从各个研究组织给出的检索性能看来,克服“语义鸿沟”难题仍需要我们进一步探索。
其他文献
正交频分复用(Orthogonal Frequency Division Multiplexing,简称OFDM)技术已经成为下一代无线通信标准的核心技术。随着频谱利用率的提高,同频干扰(Co-Channel Interference
随着嵌入式技术与无线通信技术的发展,由此孕育而成的无线传感器网络也被广泛应用于工业控制、环境监测等领域,实现了人与人,人与物,物与物之间紧密的信息传递。无线传感器网络虽
摘要:传统词汇教学缺乏对情境的关注,忽视了语篇,无标度网络原理及语篇语言学理论都提到联系的重要性。本研究在前人研究的基础上,提炼出词汇教学的模型:教学计划、 教学策略、评价方式以及反思调整。该模型基于语篇的教学理论为理论支撑,力求通过阅读和词汇策略的学习应用,让学生真正掌握词汇。行动研究表明,该模型在根据学生情况调整的情况下,对学生的词汇学习确有帮助。  关键词:语块;语境;语篇;词汇教学模型  
无线网络视频是对带宽要求高,实时性强,容易出现网络拥塞或者质量不能满足用户要求等问题,但用户并不关注网络的具体情况,在意的是业务的实用性、舒适度等主观感受,因此在评
第三代移动通信系统要求能够支持不同速率、不同业务的用户.DS/CDMA系统,由于其潜在的系统容量和灵活的空中接口,受到了广泛的重视.在DS/CDMA系统中,支持多速率传输的方式很