论文部分内容阅读
随着互联网技术的发展进步,各行各业通过网络产生了大量序列数据,利用序列数据进行预测,并挖掘其复杂动态性背后隐藏的内在规律,对于用户兴趣动态挖掘、电子广告实时推送、设备故障检测、交通故障预测等方面都具有重要的社会意义。但是,当前序列预测方法仍然存在信息未被充分利用的不足。因此,本文对融合了社交数据的点过程序列预测算法进行研究,利用了历史序列数据预测事件类型和时间。主要工作和创新点如下:(1)针对缺乏考虑不同维度信息的问题,本文提出一种社交化点过程序列预测算法(Social point process sequence prediction algorithm,SPSP)。通过同时考虑时间和空间两维度信息建模点过程强度函数,将社交关系网络引入点过程序列预测算法中,打开了建模强度函数的新思路。SPSP算法训练过程:首先在时间维度上,利用双LSTM分别建模强度函数的背景知识和历史影响;然后通过联合层将两个LSTM的输出合并,生成事件类型的预选表征和对应的事件时间;最后在空间维度上,将事件类型的预选表征作为输入,根据社交关系网络的邻居影响度算法优化重构强度函数,训练整个模型,预测最终事件类型和时间。(2)针对利用循环神经网络建模点过程时缺乏可解释性的问题,本文提出一种基于注意力机制的社交化点过程序列预测算法(A social point process sequence prediction algorithm based on attention mechanism,ASPSP)。ASPSP算法在事件序列训练中加入注意力机制,解决了由于所有上下文输入信息被压缩为定长向量导致模型预测能力受限的问题。经验证,算法的预测能力和关系挖掘能力得到提高,且算法建模过程更具可解释性。(3)在实际应用上,本文提出的算法具有可移植性和可扩展性,可以应用于跨度较大的不同领域中。比如社交网络领域的微博类型预测、设备维修领域的电梯故障预测和交通领域的事故地点预测等。本文分别在新浪微博数据集和电梯故障数据集上进行算法验证,将Logistic、RMTPP、TRPP、ERNN、TRNN等多种算法作为基准对比算法,其中,预测事件类型的评价指标为:Precision、Recall、F1值和Accuracy,预测事件时间的评价指标为:MAE。实验结果证明本文ASPSP算法具有更优的预测性能,可以高效准确地预测出下次事件类型和时间。