跨媒体搜索关键技术

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:nicday
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体设备的不断更新以及移动应用技术的快速发展,多媒体尤其是视频媒体传播越来越广泛,人们对视频搜索系统的要求也日益增长。本文研究了跨媒体视频检索中视频语义的分析与提取、基于场景的视频聚类等关键问题。主要的工作如下:1、提出一种跨媒体视频搜索框架,能够利用视频中的图像、音频、文本等多种媒体信息完成视频搜索。实现了对视频元数据和查询query的文本分析预处理,完成拼写检查、去停用词、词干提取和词形还原等操作,抽取出文本中的关键信息。在视频语义信息提取方面,提取出音频信息、文本信息,以及人脸和常见物体等概念语义,并以文本形式输出。用lucene分别对视频元数据和视频语义信息建立索引,完成视频搜索和排序。该系统适用于海量网络视频搜索,并在TRECVID-KIS视频搜索任务数据集上进行测试,MAP值为0.265,验证了有效性。2、在视频的语义信息提取方面,提出一种基于笔划宽度的文本检测算法,能够有效地检测和识别出视频中所包含的文本。视频中的文本信息通常为视频的标题或描述等,起着辅助理解视频内容的作用,因此文本信息、相对于其它媒体信息能更直接地体现视频的主要内容。本文采用笔划宽度和颜色特征相融合的文本检测算法,能够有效地把文本和背景区分开来,并筛选出文本区域。最后用OCR软件对文本进行识别。该算法应用在跨媒体视频搜索框架,使搜索结果得到稳定提升。3、提出一种基于场景的视频聚类算法,通过分析视频的场景,对视频提取更高层次的语义信息,用BoW模型对视频特征进行量化,采用谱聚类算法对视频进行无监督聚类。通过把描述同一个事件的视频聚到一起,自动地为视频附加类别标签,应用在最后的视频搜索过程中。在自建的网络热点事件视频库上进行测试,测试结果表明该方法能提高检索的查全率。
其他文献
现代研究表明白藜芦醇(Resveratrol)具有抗癌、抗氧化、抗血小板凝聚、抗菌、调节脂类代谢、保护心血管系统和神经系统等多种功能,从己查文献中可知虎杖中的白藜芦醇含量是迄
IPoverWDM将成为IP高速骨干网的主要技术。将光网络的发展和IP相结合,可以充分利用光网络的透明传输优越性和光纤的巨大带宽。从而,对IP业务量的特性以及其在光网络中特性的变
随着遥感技术在国民经济建设中得到越来越广泛的应用,大量遥感卫星将在未来10年投入使用,由此带来的将是遥感数据的爆炸性增长;与此同时,不断积累的大量存档数据亦将具有越来越重
随着空间技术的发展和遥感应用需求的不断增加,遥感影像在众多领域发挥着越来越大的作用。由于各种因素的影响,遥感影像不可避免地存在几何变形,需要对其进行纠正。从地形图选取
无线传感器网络(Wireless SensorNetwork, WSN)是由大量低成本、低功耗、具有信息采集、数据处理和无线通信等功能的传感器节点通过自组织方式形成的网络,广泛应用于军事监视
我国是世界上高速铁路处于前沿水平的国家之一。计算机联锁系统的性能对于行车安全、效率至关重要。因此,对其安全评估研究迫在眉睫。本文基于我国缺乏独立、可靠的高速铁路
合成孔径雷达(Synthetic Aperture Radar, SAR)是一种主动式电磁波成像探测器,可全天时全天候提供目标区域的二维高分辨率图像。利用该图像信息校正惯性导航系统(Inertial Nav
正交频分多路复用技术OFDM由于具有抗频率选择性衰落、频谱效率高和抗窄带干扰的优点,在现代通信中越来越受到重视。OFDM技术能增大系统容量,提高数据速率,提高数据传输质量,是高
无线传感器网络已经成为当今的热门研究领域之一,其集成了微型传感器、无线网络、嵌入式处理三大技术。随着科技的不断发展,无线传感器网络已成功应用于军事和商业等很多领域。
无线通信、特别是移动通信的蓬勃发展,需要在有限的频谱范围内划分出更多的频段给不同的运营商,以满足多种通信业务的需求。为避免信道间相互干扰,需要在所有的系统内配置高性能