论文部分内容阅读
现在,越来越多的公司针对自身的业务都建立起了自己的话务呼叫中心,以帮助他们通过电话来了解和处理客户遇到的问题,从而提升公司的业务水平。近些年来,随着移动互联网的高速发展,移动设备也随着急剧增长。结果,话务呼叫中心的呼叫业务量大大增加,给话务呼叫中心的服务带来了巨大的压力。话务中心的业务量庞大,相对应的员工数量也特别多,人员成本占总体运营成本的大部分。为了更加有效管理人员,平衡人员成本和服务质量,必须制定人员配置和调度策略。对话务量的准确预测是人员排班的关键,提前了解不同时间段的未来话务量可以帮助话务呼叫中心进一步提高服务质量。本文解决的话务量预测场景中,话务呼叫中心需要在本月月底安排好下个月所有时间段的每个人员的班务,因此必须提前知晓下个月所有时间段的话务量,才能根据人员的话务能力进行人员的配置和调度。本文的目标是为了预测出在不同月份所有时间段的话务量,使得预测出来的话务量尽可能的贴近实际话务量。现有为话务呼叫中心提供的预测算法在解决上述问题中,普遍存在如下缺陷:(1)预测目标定位不够准确:仅仅是对来电量进行预测,而忽略了来电通话时长,导致对话务呼叫中心对人员安排的参考指标出现较大的偏差。(2)预测时长不合理:没有从话务呼叫中心的实际需求出发,大多数现有算法仅仅关注下一小时或第二天的短期话务量预测,无法应对在长期时间中复杂的话务量预测,导致话务呼叫中心无法进行长期的班务安排。(3)预测步数不合理:大多数的现有算法仅仅关注下一时间段(单步)的话务量值,没有进行接下来多时间段(多步)话务量的预测,导致话务中心无法根据长期时间中每一时间段的话务量来进行人员的安排及调度。为了解决上述问题,本文首先明确了话务量作为预测目标,因为话务量同时考虑了来电量和通话时长两个因素。接着考虑到话务量是属于时间序列的一种,本文首先采用具有长短期记忆的神经网络按时序数据来预测话务量,神经网络会通过训练模型和调整参数来挖掘出输入和输出时间序列之间潜在的依赖关系。然而,通过神经网络挖掘出的依赖关系的可解释性和鲁棒性差,再加上话务量又受时间、节假日、突发事件等因素的影响,本文根据在不同时间维度挖掘出有效的周期性时间、话务量依赖特征,采用集成学习的随机森林算法进行话务量预测,最后根据特殊假期时间采用均值预测算法。本文最后设计了不同算法的实验来对比分析在不同时间情况下的话务量预测结果。实验表明,基于随机森林的话务量预测算法表现优于基于长短期记忆网络的时序数列话务量预测方法。在数据分布比较平衡的情况下,基于随机森林的话务量预测算法中考虑尽可能多的有效特征,话务量预测能够准确;在数据分布不平衡的情况下,例如春节期间,直接采用均值进行预测,话务量预测更加准确。