论文部分内容阅读
随着大量视频分享网站及各类视频应用在互联网上兴起并流行开来,网络视频数量呈爆炸性增长,而且视频主题内容种类繁多,形式多样,方面丰富了网民用户的观看选择,另一方面也为这些视频数据的发现、组织和归类带来了巨大的挑战。聚类是一种不依赖高质量训练样本集和过多人工参与的非监督机器学习技术。借鉴聚类在文本检索中的应用,聚类可以被用来解决网络视频的组织和分类问题。目前网络视频的聚类主要是基于视频内容的图像特征米表征视频并度量视频间的相似度,进而利用视频间的相似度关系进行聚类分析。由于图像分析中的“语义鸿沟”问题,现有的网络视频聚类方法仅使用图像特征并不能全面准确地表征网络视频,因而影响最终的聚类效果。本文针对网络视频信息量丰富、数据结构复杂的特点,提出一种基于多模态策略的网络视频聚类方法,包括了网络视频表征方案、相似度计算方案和采用的聚类算法。该方法充分利用网络视频蕴含的信息,选取低层图像、高层语义和文本三个模态下的特征来表征网络视频,设计了各个模态下视频相似度的计算方案,并将三个模态的相似度进行融合得到网络视频的实际相似度,最后引入Affinity Propagation算法执行聚类分析。本文通过在网络视频基准数据集上进行的实验结果表明,文中提出的方法较现有方法在聚类的准确度上有更好的效果。本文最后还将该方法应用到视频搜索结果聚类组织中,对具有不同主题内容的网络视频进行了区分和归类,可以改善用户搜索体验。