论文部分内容阅读
流程挖掘在社会日常生产工作中起到非常重要的作用。但是,由于当今市场的竞争和技术的升级,系统的流程会趋向于弹性化、灵活化。因此,需要感知系统流程变化和变化后的流程对于当前系统运作的影响,以及如何优化和控制变化后的物质资源和人力资源的分配。目前,在复杂的流程中很难通过人工的方式检测流程各个点的细小变化,此时需要一定的技术用来自动的动态监测复杂流程系统中流程的变化。通过检查流程的变化可以及时对整体流程做出调节、优化。当系统流程出现问题时,可以清楚的、方向明确地排查问题根源。在流程挖掘领域,这项技术称为“基于流程挖掘的概念漂移的侦测”。传统的流程挖掘领域中概念漂移算法大多对变化识别率低、算法复杂度高,更为重要的是没有应用到流程的上下文周边环境。流程上下文环境的应用将会是流程挖掘领域的下一个突破点。本文在原有的研究基础上,提出了一种新型的算法。该算法通过计算样本之间的结构属性(关联系数、关系熵、跟随矩阵),以及上下文属性(时间属性,人员属性),利用属性矩阵获得日志之间的距离,利用假设检验技术实现对样本的处理,发现流程运行中发生的概念漂移。算法出于时间复杂度的考虑,利用流程变化前后的稳定性,同时为减少对样本属性的提取与计算,通过先计算大日志块,然后逐步细化,最后将漂移点收敛至概念漂移发生的位置,从而侦测到概念漂移。另一方面,算法为了提高精确度,利用上下文环境中时间的变化和任务完成者的变化来提高算法对流程变化的敏感性。本文最后设计了相关实验对算法验证。试验结果表明,在日志规模在200、2000、20000的情况下,本文提出的算法均能发现所有的漂移点,并且不会出现参数误判现象;但是原始算法在200、20000日志规模情况下,会发生漂移的丢失或者误判现象。通过本文的论述和实验,本文提出的算法无论是在理论设计上,还是实验结果上,相对于已有的研究成果都有了不同程度的进步,从时间效率、精确度上均表现出了非常优异的效果。