论文部分内容阅读
从移动大数据中挖掘异常轨迹是大数据安全分析研究领域的重点研究内容。与传统的异常轨迹检测研究相比,这类研究需要处理的数据量更大、数据种类更复杂,因此难度更高,主要体现在如何从原始数据中挖掘移动对象之间的关联,并进一步利用该关联检测移动对象的异常轨迹,尤其是无规则移动对象的异常轨迹。针对这一具体问题,本文做了如下两点研究:第一、提出一种基于TF-IDF(Term Frequency-Inverse Document Frequency)理论的相似用户检测方法TTSUDM(TF-IDF Theory-based Similar User Detection Method)。该方法主要解决的问题是从原始数据中挖掘用户之间的关联,实现步骤如下:首先从原始数据中挖掘用户的停留区域;然后从停留区域中挖掘用户的停留位置;最后利用TF-IDF理论计算每个停留位置对用户的重要性权值,并结合余弦相似性计算用户之间的相似度。实验结果表明,该方法的理论思想完全符合预期假设,能准确地检测出相似用户。第二、在上述研究的基础上,提出一种相似用户之间的异常轨迹检测方法ATDM-SU(An Abnormal Trajectory Detect Method among Similar Users)。该方法主要解决的问题是检测无规则移动对象的异常轨迹,实现思路如下:首先通过TTSUDM检测相似用户,选取相似度较高的用户群作为检测对象;其次从该组用户群的原始数据中挖掘移动轨迹;然后提出轨迹邻居点的定义,计算轨迹之间的关联;最后提出异常轨迹的定义,实现无规则移动对象的异常轨迹检测。实验结果表明,该方法比传统的异常轨迹检测算法计算量更小、性能更好、更适应大数据环境,同时对结果进行统计,得出该方法在本文特定的实验环境下具有50%~70%的准确率。