论文部分内容阅读
对用户忠诚度演进的研究,有助于我们理解互联网用户的视频观看行为,评估系统质量,建立系统负载模型和优化系统算法以及分析预测系统性能。用户行为分析领域的现有工作都是基于用户行为的静态数据,并未考虑时间因素,也没有综合衡量用户忠诚度的指标;因此本文旨在建立用户综合忠诚度的模型,并且从时间维度观察用户在生命周期中行为的演变。为了挖掘视频点播系统用户忠诚度的演进,本文的研究可分解为以下三个循序渐进的问题的探索。1)如何定义用户忠诚度,其在时间上的演变曲线如何?本文利用了层次分析法模型以建立用户综合忠诚度模型,并通过统计对用户行为的时间变化进行测量。2)用户的生命周期长度是否能利用尽量少的数据预测?本文利用机器学习框架的分类器算法,使用用户初入系统第一周的行为数据,对用户的生命周期长度进行预测。3)用户访问系统的行为能否模型化、理论化,能否应用到系统层面?本文基于百万级别的样本集合统计了用户访问系统行为所涉及的各种概率分布,给出了具体的数学模型以描述这些概率分布函数;并在此基础上提出了系统用户流量预测模型。通过研究上述问题,本文得到主要结论如下:用户访问系统行为是具有固定模式的,其忠诚度、活跃度随着时间发展同样具有固定模式,不同访问行为类型的人群活跃度不同。另外,用户在系统内的生命周期长度的信息可以通过用户在系统内第一周的行为数据获得;而某周初次访问系统的用户往后每周访问系统的用户数流量,也可根据初次访问的这周数据获得。本文创新之处在于从生命周期视角对视频点播系统用户行为进行了分析,引入了层次分析法和机器学习等多种研究工具;对用户访问系统的行为以及系统用户流量给出了具体的数学模型。另外本文提出的用户生命周期定义、用户忠诚度模型、用户访问模式也是对传统用户行为分析方法的创新。