机器学习在影视大数据分析中的研究及应用

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:richard8517742
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
影视产业作为我国国民经济体系中新的突破口,广受影视市场主导人员、电台运营商、各大视频网站运营机构以及一些科研学者的关注。面对大数据时代的到来,影视行业的数据存储、处理和分析等多个方面也面临着巨大的挑战,传统的数据存储模式、数据处理方法和数据分析技术将无法满足拥有海量数据的应用需求。随着数理统计理论及人工智能等诸多领域的不断发展,基于机器学习的理论体系逐渐构建起来,人们试图应用机器学习方法去对海量数据进行处理分析,以期从中提取出有用的知识和信息。因此,研究如何运用机器学习方法从海量影视大数据中挖掘出数据背后隐藏的特征和波动趋势,是具有重大的现实指导意义的。本文主要是利用机器学习方法来对影视大数据进行处理与分析,同时结合智能影视大数据分析系统对海量的电视剧收视相关数据先后进行预处理、特征降维、图表分析与收视预测,其增加了数据处理的效率和收视预测的准确性。因此,通过机器学习方法来解决影视大数据场景中的问题具有重要的意义,其给予了研究人员有效的应用思路,也为影视企业赢取最终市场并获得更高收视率创造了可能。本文的主要工作如下:[1]基于K-Means聚类算法对高维影视数据进行预处理。其针对筛选出的电视剧样本数据进行属性选择、数据聚集和数据规范化,最后利用K-Means算法对数据进行补全操作。[2]基于因子分析法对高维影视数据进行降维处理。其针对高冗余、高维度的电视剧特征数据,运用因子分析法来获得低维的冗余性小的影响因子作为降维后的特征向量。[3]基于SVM算法和AdaBoost-BP算法对电视剧收视水平和收视率进行分类与预测。其使用降维后的电视剧特征数据,运用SVM算法和AdaBoost-BP算法来建立收视预测模型。之后对相关数据进行预测分析。最后对比分析预测效果,总结出更具有效性的预测算法。[4]基于智能影视大数据分析系统对收视进行分析与展示。其针对处理后的电视剧收视相关数据,多层次多角度地进行图表关联分析与直观展示,并把文中提出的预测模型运用到影视大数据收视预测中,验证了其有效性。
其他文献
汉语国际教育专业文学课是在全球化文化交流的背景下创设的,旨在培养跨文化交际人才的汉语文学、文化与跨文化交际的基本素质。为克服教学内容丰富而课时量少的矛盾,在教学内
目的评价冰冻血小板临床输注的有效性,以及冰冻血小板的保存液二甲亚砜(DMSO)对人体的影响。方法选择2016年1月1日至2017年6月30日在西南医科大学附属医院输注过血小板并符合
当今广播电视事业的发展已经进入“主持人时代”。主持人在节目中起主导作用,国外电视界把主持人视为提高节目收视率的关键人物。大凡有影响的节目,其主持人必定闻名遐迩。节
<正>今天"茂名石油荔枝文化博览会·荔枝文化研讨会"在这里隆重召开。在此,我代表茂名市政府和茂名700万人民向与会的各位专家、学者,各位代表表示衷心的威谢!感谢你们在百忙
本文是根据我校篮球运动员战术意识运用较差、基本功薄弱的特点,探讨怎样的训练方法才能更好的培养青少年篮球运动员篮球意识,有助于提高他们的篮球训练,同时也大大促进了青
贵州省有东、南、西、北四路花灯,独山花灯被认为是贵州省南路花灯的代表。独山花灯的发展有过繁盛期,也有如今的低谷期。从对独山花灯的实地考察中引发出对独山花灯民间艺人和
超分子化学被定义为“超越分子以外的化学”,是通过多种非共价作用力形成的复杂有序且具有特定功能的组装体系的一门交叉学科。自从1987年,三位化学家Pedersen、Cram和Lehn获
人体肠道内定植了大量的细菌,它们参与机体多种生理功能的维持。大脑与胃肠道之间通过脑-肠轴进行双向关联。近年研究发现肠道菌群与脑-肠轴可相互作用、相互影响。肠道菌群
化学链重整是一种新型的合成气制备技术,为提高化学链重整气中H2含量,捕集CO2,提出化学链重整联合CO2捕集制氢系统。采用Aspen Plus对化学链重整过程进行模拟,结果表明:化学
广域继电保护大范围、分布式的信息采集方式,以及自然灾害等因素,较易引起信息出错、丢失,甚至信息通道受损,信息的完备性直接影响保护的性能。针对现有广域继电保护研究对信