基于多模态策略的网络视频聚类方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:suyihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大量视频分享网站及各类视频应用在互联网上兴起并流行开来,网络视频数量呈爆炸性增长,而且视频主题内容种类繁多,形式多样,方面丰富了网民用户的观看选择,另一方面也为这些视频数据的发现、组织和归类带来了巨大的挑战。聚类是一种不依赖高质量训练样本集和过多人工参与的非监督机器学习技术。借鉴聚类在文本检索中的应用,聚类可以被用来解决网络视频的组织和分类问题。目前网络视频的聚类主要是基于视频内容的图像特征米表征视频并度量视频间的相似度,进而利用视频间的相似度关系进行聚类分析。由于图像分析中的“语义鸿沟”问题,现有的网络视频聚类方法仅使用图像特征并不能全面准确地表征网络视频,因而影响最终的聚类效果。本文针对网络视频信息量丰富、数据结构复杂的特点,提出一种基于多模态策略的网络视频聚类方法,包括了网络视频表征方案、相似度计算方案和采用的聚类算法。该方法充分利用网络视频蕴含的信息,选取低层图像、高层语义和文本三个模态下的特征来表征网络视频,设计了各个模态下视频相似度的计算方案,并将三个模态的相似度进行融合得到网络视频的实际相似度,最后引入Affinity Propagation算法执行聚类分析。本文通过在网络视频基准数据集上进行的实验结果表明,文中提出的方法较现有方法在聚类的准确度上有更好的效果。本文最后还将该方法应用到视频搜索结果聚类组织中,对具有不同主题内容的网络视频进行了区分和归类,可以改善用户搜索体验。
其他文献
随着高速接入网快速发展,终端用户可以获得更快速,更高质量的服务;同时,接入网络也可能因为自然灾害或者其他不可预测的因素,导致网络发生故障而影响用户的正常使用甚至给用户
目的:循环内皮细胞(circulating endothelial cells,CECs)产生于血管损伤过程。血管损伤与多种疾病的发生息息相关,这其中包括了急性心肌梗塞(acute myocardial infarction,A
甘肃鼢鼠是我国黄土高原特有的营地下生活的鼠类,终年生活在地下黑暗的洞道内,很少在地面活动,其洞穴呈封闭状态,生活的空间格局对其身体结构、生理机能及感觉器官产生了深刻的影
本研究以HPLC等仪器分析手段测定显齿蛇葡萄Ampelopsis grossedentata(Hand.-Mazz.)W.T.Wang中二氢杨梅素及其生源相关黄酮苷元的含量,并借助SPSS软件分析相关性,明确二氢杨梅素代谢积累的关键前体及竞争性底物。1)建立了HPLC分析检测显齿蛇葡萄叶中二氢杨梅素的方法,回归方程为:Y=28327X-101.2(R2=0.996),定量限为35.74 ng,在0
随着互联网技术与产业的急速发展,网络中的数据量越来越庞大,涉及的领域、网站的种类与日俱增。在享受海量信息的同时,获取特定目标信息的难度也不断增加。对网站的标签标识
信息科学一个重要的课题是如何准确、有效、简洁的表示图像数据,图像压缩是其中的一种简洁的表示图像数据的有效手段,它以较低的资源(信道)和经济代价实现了人类观看和使用视