论文部分内容阅读
随着民航事业的不断发展,旅客数量和航空业务也在快速增加,国内很多机场都建设了大型航站楼。偌大的航站楼对于机场管理方来说,如何规范员工行为、优化员工工作流程、施行更高效的安全管理,并识别异常的员工行为,已经成为一个非常艰巨的任务。解决上述问题的关键在于:门禁管理系统是航站楼实施物理访问控制的重要环节,大型航站楼的门禁管理系统的控制点众多,现有的门禁管理系统能够对所有控制点进行统一管理,并记录日志。如此多的控制点每天产生多达数万条的记录,据此可获取各个部门员工的路径信息,发现员工的正常行为模式和异常行为模式,为机场管理方提供服务。本文以某机场航站楼的门禁管理系统日志为研究对象,从序列模式挖掘和物理入侵检测的角度进行探究,提出了改进的PrefixSpan算法和子序列匹配定位算法,这两种算法能够合理的挖掘出员工的行为模式。主要研究内容:一、详细阐述了序列模式挖掘的三种算法,以及异常行为检测中的模式匹配算法,为后面的研究提供理论基础。二、详细阐述了航站楼内员工路径数据的预处理过程,包括数据清洗,等价类划分等。三、鉴于员工门禁路径数据的独特性,传统的数据挖掘算法已不适合,本文在路径编码的基础上提出了一种改进的Prefix Span序列模式挖掘算法。该算法在时间和空间上都进行了优化,首先在递归挖掘过程中,只检查投影数据库序列关于前缀的最近后缀,避免产生非法的频繁序列及其投影数据库;然后在构造频繁前缀模式的投影数据库前,检测前面是否已构造过此前缀模式的投影数据库,避免对同一频繁前缀模式构造重复投影数据库;最后在投影序列数小于最小支持度时停止扫描,减少非法频繁序列及其投影数据库的产生。运用本文算法挖掘各部门员工的频繁路径,即员工的正常行为(高频行为)模式;把得到的正常行为模式构建成正常行为模型树,采用基于先序遍历树的子序列精确匹配定位算法,检测员工的异常行为,即异常行为模式。四、把员工的正常行为模式和异常行为模式应用到行为分析中,设计了一个航站楼员工行为分析原型系统。