论文部分内容阅读
网络在线视频观看发展迅猛。全球视频流量已经占到了互联网流量的70%以上。随着智能手机的普及、无线技术的发展,移动视频流量在互联网中占比已经接近三分之二。网络流量负载很大。基于视频流行度的长尾分布特征,采用对热门视频内容进行缓存,是目前服务商和网络运营商普遍采用的策略。如何基于视频观看行为数据的分析,进一步优化缓存策略是本文的研究重点。本文主要工作如下。第一,首先从用户观影行为和视频流行度两方面对新浪视频观看数据进行了分析。发现用户的观影行为主要集中在8-24时,并且存在中午和晚上两个观影高峰时段。视频流行度则具有三种特征:第一,20%视频占用了80%流量;第二,视频的流行特性在不同地域以及不同ISP(Internet Service Provider,网络服务提供商)内是相同的。第三,单个视频流行时间一般可以维持一天。第二,以网络流量开销最小化为目标分别建立了ISP独立缓存和协作缓存优化模型。与独立缓存相比,协作缓存方案流量开销能够节省83.28%。但是算法复杂度太高。为此引入聚类方法通过减小解集空间降低复杂度,将求解时间缩减到原来的万分之一。针对聚类方法导致的缓存冗余度增大问题,进一步引入了基于拓扑结构的贪婪式的去除缓存冗余算法,能够缓存更多的全网热门内容,增强网间协作,使得在时间开销维持在同一数量级的同时流量开销节省81.36%,性能接近最优方案。第三,由于视频流行度会随着时间的推移而变化,缓存更新必不可少。普通更新算法主要包括离线更新和在线更新两种。离线更新缓存短时间效果接近最优解,在更新周期内随时间推移效果下降。在线更新算法能够维持较好缓存效果,但是算法累计复杂度很高。我们在之前的分析发现最流行的前10%视频流行度变化比较缓慢,而这一部分正是我们所要缓存的内容。所以本文提出了以离线更新为主中间穿插基于访问率的在线更新算法。使得缓存节省带宽的能力在整个更新周期内都保持稳定有效。第四,在用户密集的移动接入环境下(例如体育场),基站的终端管理能力和带宽能力都表现出不足。本文提出了D2D辅助的内容分发算法,通过在一个D2D小组内缓存热门内容,使得本来应该由基站提供的流量限制到D2D小组内部。NS3仿真结果表明,可以使用户需求满足平均时间降低为原来的29.06%。