面向在线视频弹幕数据的挖掘方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:feixiang20090911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的跨越式发展,使得流媒体服务的获得越来越便捷,让用户能够随时随地观看在线视频。但随着用户需求的变化,用户己经不满足于观看视频这一基本功能,更希望能够在观看视频的过程中表达自己的情绪和建议。而传统的点“赞”、点“踩”和撰写评论等手段,难以实现用户在观影过程中情绪表达和同伴沟通的目标。近年来,一种面向视频的新交互行为(又称“屏显评论”或“弹幕”)流行起来。弹幕是一种由用户撰写、与视频放映时间相关、实时显示在视频屏幕上的一种评论,这种评论与视频的情节和放映时间实时相关。同时,用户通过弹幕能够实时地与其他用户沟通和交流观影感受。除此之外,视频制作方能够通过弹幕这种新型的交互行为了解到用户对视频各个片段的情绪和建议,进而针对性地改进后续制作的视频。目前,几乎所有的国内视频网站(爱奇艺、腾讯等)都采用了弹幕功能。这种新型的用户与视频交互行为具有一些新的特性(如多峰、羊群效应)和广大的实际应用价值。同时,它所具有的新特性也给实际的研究带来了新挑战,如使得视频流行度的预测具有了更多不确定性。但相较于在工业界的广泛流行,针对弹幕这种新交互行为的学术研究刚刚起步,目前为止还没有基于数据驱动视角的相关研究。基于以上背景,本文提出利用数据挖掘技术,结合心理学、商学等交叉学科知识,设计建模方法,实现对在线视频弹幕数据的全面理解。本文主要工作概括如下:首先,对弹幕数据的新特性进行系统分析与量化建模。这种新的用户与视频交互方式具有巨大的学术研究与商业应用价值,但还没有相关工作对弹幕的新特性进行深入分析。鉴于此,本文从不同的角度对弹幕的特性进行刻画:第一,对比了弹幕与传统评论的差异性;第二,设计了弹幕羊群效应的量化模型;第三,设计了弹幕多峰现象的检测模型;第四,设计了关键弹幕的识别模型;最后,分别构建了弹幕在视频和视频片段上的增长趋势模型。真实数据集上的实验结果验证了所提方法的有效性。其次,针对具有弹幕功能的在线视频流行度预测的不确定性问题,提出了多因子流行度概率预测模型。相比于传统的在线视频,具有弹幕功能的视频所蕴含的新特性,使得此类视频流行度的预测具有更大的不确定性。鉴于此,本文提出了多因子融合的流行度概率预测模型。具体而言,先从热门视频、热门屏显评论、最新上传视频三个维度构建了羊群影响因子,随后构建了上传视频用户影响因子和视频质量影响因子,最后提出了一个融合以上三个影响因子的流行度概率预测模型。实验结果表明了本文所提出的模型能够准确地预测具有弹幕功能的在线视频流行度。最后,利用弹幕的关键特性,构建了针对大规模图像分类问题的深度混合模型。相比于传统评论,弹幕评论所具有的视频实时相关性、丰富的主观(开心、愤怒等)和客观(物体、演员等)语义信息等关键特性,可用于给弹幕相关联的帧(图像)打标签(分类)。然而每一个在线视频网站包含的视频规模异常巨大,从视频中所抽取的图像规模也是成百上千万,对分类算法的性能和效能带来了巨大挑战。为了更深入地研究这个问题,将此问题一般化,即如何对大规模的图像进行分类。鉴于此,本文提出了一个用于大规模图像分类的深度混合模型。首先根据图像类别的语义相关性,提出了模糊谱聚类算法,用于构建一个两层(图像类别层和任务组层)的本体树。随后,基于构建的本体树,每一个任务组分配一个基础卷积神经网路。通过本体树中的任务组可以使得具有相同学习复杂度的图像类别被分配到同一个基础卷积神经网络中,确保了基础卷积神经网络之间的可分性。最后,设计了一个门网络用来融合各个基础卷积神经网络的输出以生成最终的分类结果。实验表明,与基准算法相比,提出的深度融合模型在大规模图像分类上有着优异表现。
其他文献
当代大学生心理健康及心理健康教育现状都不容乐观,其根本原因在于没有抓住自我教育这一心理健康教育的本质与核心。自我教育是大学生心理健康教育的本质要求和核心部分,是心
地表以下各深度煤炭的开采,都会造成地表形成大量的采煤塌陷地。文章就采煤塌陷对土地、生态、环境和社会等各方面造成的影响及破坏入手,浅析采煤塌陷对土地资源等方面的影响
油茶籽粕是一种优质的蛋白质饲料资源,但有毒物质茶皂素的存在制约了其在畜牧业中的应用。在对油茶籽粕进行脱毒的处理方法中,微生物发酵法被认为是最具有发展潜力的处理方法
<正>移动短视频作为新兴的互联网内容形式,依托4G技术获得爆发性增长,但在急速增长的过程中凸显出了同质化、低俗、抄袭侵权等问题。为维护移动短视频产业的良性发展,在短视
流动性过剩对中国经济造成了很多负面影响,引起了理论界和相关政府部门的高度重视。探讨流动性概念的起源,总结流动性的特有属性并通过定义揭示流动性的内涵;梳理流动性理论
<正>~~
会议
病号服面料的性能直接影响服装的功能性表现。基于市场销售的多种新型病号服面料,选择了3种成分相同的面料来开展选择应用研究。首先对3种面料的服用性能进行了测试,然后分析
高中化学作为主要的学科之一,对学生的成绩有着极大的影响,因此高中生在实际中必须要重视化学学习的作用,探索提升化学学习效率的方法。而对于高中生来说,学习风格的形成会对
在反全球化与对俄罗斯经济制裁增强的背景下,中俄两国的经贸合作战略意义凸显。然而,中俄传统比较优势正在不断弱化,尤其是目前俄罗斯经济进入结构性衰退期,正面临经济结构转
在中药学的学习过程中,需要记忆的知识较多,本文针对学生的具体情况提出以下几种帮助记忆的方法:(1)把握中药药性理论,确定中药分类主治记忆;(2)全面掌握药味,突出重点、抓住要点记忆;(3)