基于分类算法的移动互联网视频UGC质量评价研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:lujunjun_1204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,由用户主导生成内容的Web2.0时代逐步发展成熟,近几年移动互联网技术的发展更是给人们的生活带来巨大变革。用户生成内容(UGC)作为Web 2.0环境下一种新的内容生成及组织形式,受到大家的广泛关注。目前视频分享网站、微博、博客、问答社区是比较主流的移动互联网UGC业务形式。移动互联网为UGC的发展注入了新的动力,近几年用户生成内容的数量快速增加,然而也暴露出越来越多的质量问题,其整体质量还有待改善。选择科学的评价方法对UGC质量做出评价,才能使以UGC业务为主的网络平台的环境得到改善,在用户生成内容质量评价的基础上制定合理的激励措施有利于让用户生成更多优质内容。本文选取移动互联网视频UGC为研究对象,通过挖掘视频相关的指标数据,使用分类算法对其质量做出评价。在以往研究和视频UGC本身特点的基础上,构建了包含对象层、维度层、测度层的质量评价框架。对象层包括视频制作水平、视频内容本身、视频观看体验、视频内容效用四个维度,确保对视频内容做出全面、准确的评价。本研究在维度层指标的基础上还设计了维度层量化指标,根据维度层量化指标对视频进行人工打分,使用主成分分析方法确定指标权重,人工打分和指标权重共同得到了基于主成分分析的视频UGC质量,然后对视频质量做出高、低质量分类。本文还构建了视频UGC内容、用户交互关系模型,测度层指标均取自该模型。基于主成分分析的视频质量分类结果和测度层指标共同构成了基于分类算法的视频质量评价模型,本文将应用于该模型的样本数据分为训练样本集和测试样本集,使用训练样本集对模型进行训练,然后使用训练后的模型对测试样本集进行质量分类预测,结果表明该模型具有很强的可操作性和科学性。本文选取优酷APP自频道的用户生成视频内容进行实证分析,首先抓取了 892条视频的测度层指标数据,然后通过问卷调查及主成分分析的方法得到这些视频的质量分类情况。测度层指标数据和基于主成分分析的视频质量分类结果共同构成了样本数据,对样本数据进行样本平衡处理后,将样本数据分为训练样本集和测试样本集。以测试样本集为例,基于C5.0分类算法的质量评价模型对视频质量的分类预测准确率达到94.62%。最后本文还对四种分类算法的分类预测结果进行了误差对比及收益对比,结果表明C5.0算法的预测准确率及预测收益均为最好。
其他文献
当今世界越来越重视文化软实力,在中国以及全世界文化是人们越来越重要的方面。学校也是如此,怎么让民族音乐文化更好地传承,促进音乐教育的发展就变得十分重要。就现在的文
古代中国对于人的教育是通过"六艺"的传授来实现,"六艺"是指在周王朝古代贵族培养体系即"周王官学"中要求学生掌握的六种基本才能:礼、乐、射、御、书、数1。周王官学的培养要求从某
我国近30年的社会转型带来的变化之一,就是原本属于私人领域的家务劳动有逐渐脱离家庭,越来越社会化的趋势。检索相关文献发现,对其研究大多停留在经济学意义上的产品价值和
精神科护士属于最容易受到暴力攻击的对象[1].国内外均有研究指出,精神障碍患者实施的暴力发生率高[2-3].宁波市康宁医院系三级甲等精神病专科医院,精神科病区常年收治60周岁
目的:调查寄宿制学校教师的焦虑状况。方法:从城区寄宿制学校和非寄宿制学校教师抽取共388人,采用焦虑自评量表(SAS)进行心理测评,将结果进行比较。结果:两所学校教师焦虑总粗分均值
初中物理课程改革需要我们认清物理教学现状,以新的教学方法、教学手段、教学理念对物理学科进行创新。随着多媒体教学渗透到初中物理教学中,这种教学方式不仅能够充分调动中
本文提出了航空物流链的简化运作模型,认为机场货站是货物地面处理的关键部分,并且运用博弈论的方法进行分析,得出单一的机场货站是缺乏运作效率的。根据分析的结论,建议从两
用丽格海棠幼嫩叶片作为外植体,在不同浓度激素和光照条件下,观察了不定芽的诱导率和增殖率,对组培苗的生根和移栽情况进行了研究。
为判断闭环管理在家庭医生实施医养结合工作中的应用价值,该文结合各学者的研究成果及本人的临床经验,对其实施方法及效果进行了观察。从分析问题、制定计划、实施计划、评价
我校安排了“新课程、新理念”的研讨任务,就这个主题,我进行了深入思考。在《小学语文教师》中一篇关于“聊书”的文章,让我深受启发。围绕这个课题,我在本班进行了尝试。我
期刊