论文部分内容阅读
在我国,多数电视台从90年代后期开始使用商业性调查机构提供的收视率数据。收视率是衡量电视节目质量的重要指标,收视率统计数据已经成为电视台评价自己的节目,确定各频道和时段广告价位以及广告客户选择媒体、频道、时段和节目的重要依据。遗憾的是现有的收视率调查体系还囿于对节目进行播出后的调查、分析和评价,而缺乏对收视率进行播前预测。即使有播前预测那也是简单的线型预测,缺少主观因素,在这种情况下,节目的改版调整和新节目的推出只能凭个人经验,而不能进行科学的量化研究。
预测电视节目收视率也是一门科学,研究如何将影响收视率的种种因素转换为相关指数,并用相对精确的数学形式表现出来,以消减主观判断的偏差。国内有学者曾经使用统计学来评判收视规律,并运用数学上的简单线性回归公式,推导收视走向。但是,它只是用来对既有收视走势进行某种评判和分析,并不具有预测未来的足够能力。另外,有研究者发明了一种使用硬件设备为辅助的收视率预测系统,由于在较大程度上依赖于硬件设备,使用非常不方便,效率不高。国外较成熟的系统也只有Integral Solution为英国BBC公司开发的采用神经网络和归纳规则方法预测的收视率发现系统。
贝叶斯网络的日趋成熟为解决这一问题提供了诸多高效的方法,使进行科学的预测变得可行。贝叶斯网络是一种表示领域中变量之间概率关系的图形模型,适用于不确定性和概率性事件。本课题正是基于这种背景下采用贝叶斯网络对电视节目收视率预测模型的建立和实现进行了研究,在技术方面作了一些有益的探索。
本文在翔实地阐述了人工神经网络(ANN)、决策树(DT)和贝叶斯网络(Bayes)各自的定义、特点以及算法实现过程的基础上,分别采用ANN、DT、Bayes三种方法建立和实现了电视节目收视率预测模型,并在此基础上对各种预测结果进行了比较分析。主要研究工作和成果有:
1)对电视节目收视率的定义、作用和调查评价方法作了详细的介绍,分析了收视率定量预测的数学模型,确立了影响收视率的10个主要因素。实验表明,采用这些因素作为输入参数预测效果良好。
2)对样本数据库中的数据进行预处理,根据对影响收视率的因素作的分析确立了输入输出层的神经元个数,并依此得到人工神经网络(ANN)预测模型的基本结构。在MATLAB环境下进行多次实验,根据训练误差曲线图和预测误差曲线图确定了适合本模型的隐层神经元数目等参数。该方法的主要缺点是样本数量较多时收敛速度很慢;
3)应用决策树(DT)中的ID3算法建立收视率预测模型,通过实例详细分析了决策树的生成过程和分类规则的提取,并在Visual C++环境下实现分类结果的预测。经过多次实验表明,预测结果与实际情况基本一致,但是该方法只能得出模糊值而不能计算出具体的收视率值;
4)在分析了以上两种方法各自的优缺点之后,重点应用贝叶斯网络(Bayes)方法建立了收视率预测模型。文中全面阐述了该模型的结构、优点、算法实现策略、算法实现的具体过程,并通过程序实现,实验表明预测结果比ANN模型的计算结果更趋于实际值;
5)从训练时间和预测精度两方面对三种预测模型的实验结果进行分析比较,通过实验得出的结论是:DT的训练速度为三者中最快,但精度最低;相对于ANN模型而言,Bayes模型的训练时间更短,精度更高,因此三种模型中Bayes模型的预测效果最佳。
综上所述,DT和ANN都有各自的优缺点,而混合Bayes结构,既有DT与ANN的优点,又克服了DT只能给出0-1两态值和ANN解决大规模问题时速度慢的缺点,预测效果最优,较适合用于对影响因素多、样本数据库大的电视节目收视率分析系统建立预测模型。Bayes模型在相关预测领域中也有很好的应用前景。