一种准实时数据处理云视频QoE分析平台

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:po689322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着日新月异的技术发展,视频服务业也涌现出了一批优秀的服务提供商。为了给视频服务提供商提供参考,研究者的研究方向也逐渐从服务质量(QoS)转到用户参与度(用户体验的一种QoE)。另一方面,随着社会节奏的加快数据时效性也越来越重要,而视频数据量的增大也给数据处理能力带来了更大的挑战。传统数据分析方案效性差、准确性低且不易扩展和移植。因此,构建一种具有大规模实时数据分析处理能力的QoE分析方案势在必行。本文重点阐述了算法选择与改进、数据处理平台的部署与改进、实时数据处理方式三方面改进工作,具体内容如下:(1)本文提出了改进的均值归一化AMKNN算法为了证明匹配算法的适用范围,本文参照数据分析一般规则,在不同数据集下比较了多种算法,最终选取了改进的均值归一化MKNN算法用于实时数据匹配。为了进一步提高匹配实时性,本文结合K-means聚类提出了改进的均值归一化AMKNN算法,它具有准确性高、处理速度快、适用范围广三方面特点。具体工作可以总结为以下两部分:第一,本文改进了模拟实时匹配阶段数据集,提出了均值归一化MKNN算法,这种算法不仅匹配错误率降低了70%,而且同时适用于在线和离线匹配。第二,本文结合K-means聚类,引入交叉聚类的概念并提出了均值归一化AMKNN算法,该算法以1%的误差为代价减少40%的计算复杂度。(2)本文基于Lambda架构在DCOS上部署了改进的LKS系统为了改进传统数据分析处理平台,本文引入并改进了LKS(Logstash+Kafka+Spark)数据处理方案并在自主搭建的DCOS上构建数据处理平台。LKS可以大大增强平台的数据处理能力,DCOS又为平台带来了资源利用率高、可扩展可移植性好等特点。为了提高容错性,本文还引入了Kafka缓存和WAL技术。实际使用结果表明,基于DCOS构建的改进LKS方案与基于传统方式构建的ELK方案相比,无论在部署速度、可扩展、可移植性、吐出量、还是处理能力上都更胜一筹。(3)本文引入双层窗口数据预处理和被动定位为了提高实时数据处理方案的可靠性并支持多样化数据采集,本文提出了双层窗口预处理技术与被动定位技术。双层窗口技术的第一层窗口用于提高数据时序性,双层窗口技术的第二层窗口用于提高资源复用率从而降低计算复杂度。实验结果表明,本文引入的双层数据预处理技术把Spark Streaming处理错误降低了80%,在一定条件下上可以减少10%的额外计算开销,而被动定位则为实时处理系统提供了多样化数据维度支持。
其他文献
扩频通信,即扩展频谱通信(Spread Spectrum Communication),它与光纤通信、卫星通信,一同被誉为进入信息时代的三大高技术通信传输方式。随着个人通信业务的发展以及全球定位
LTE(Long Term Evolution,长期演进)是3GPP近年来启动的最大新技术研发项目,以正交频分复用/频分多址(OFDM/FDMA)为核心技术,被看作“准4G”技术。当前LTE商用邻近,终端被认为是
随着移动通信业务的不断扩大,有限的频谱资源和不断增长的系统容量需求之间形成了矛盾。在实际通信中广泛存在的多径干扰、多址干扰、信道衰落等对系统性能和容量产生了严重的
随着人们对多媒体信息需求的日益增长,多媒体技术的发展突飞猛进。作为多媒体技术的核心,视频处理技术也得到了高速发展。大量的视频数据对传输带宽和储存空间都提出了很高的
如今高速无线应用的需求不断地对无线电频谱资源带来压力。这种需求带动了动态频谱接入(DSA)技术的发展,这种技术能够更有效地开发利用有限的频率资源。一方面,认知无线电(CR
图像融合是信息融合一个非常重要的分支,是通过一种特定算法将两幅或多幅图像合成为一幅新图像,以最大限度地获取对目标或场景的完整信息描述。多分辨率分析方法在信号和图像
以太网无源光网络(EPON)综合了以太网技术成熟、成本低、兼容性好以及无源光网络的高可靠性和便于运营维护等优点,成为目前最具吸引力的用户接入网解决方案。EPON采用的是点