论文部分内容阅读
过程挖掘是把数据挖掘技术和过程建模方法相连接的新兴技术,给定信息系统记录的可观察行为的日志,运用过程挖掘技术从中提取有用信息,通过分析从而自动地建立描述这些行为的过程模型,还原业务流程的运行过程。在信息技术高速发展的环境下,业务流程管理系统对企业具有越来越重要的作用,而信息系统在运行过程中会记录大量的日志文件,利用过程挖掘技术能够还原运行过程,从而有助于企业改进业务流程。因此,研究过程挖掘方法具有重大的理论价值和应用价值。以往基于事件日志的过程挖掘方法大多是根据任务间的因果关系来进行的,主要是根据任务间的直接依赖关系构建过程模型,具有很大的局限性。现存的过程挖掘方法中,虽然有能挖掘间接依赖的方法,却没有从过程行为的角度进行分析。行为轮廓关系能够很好地描述活动间的次序关系,所以可以用行为轮廓关系来表示事件日志中任务间的因果关系。另外,当事件日志中所含日志轨迹或任务数量过多时,挖掘过程是比较耗时的,由于运行时间过长而导致挖掘效率低,因此,如何快速高效地进行过程挖掘也是一个值得研究的问题。针对这两个问题,本文基于Petri网及事件日志提出了两种过程挖掘方法,经过验证,能够很好地解决这两个问题。本文的主要贡献如下:(1)以往的过程挖掘方法,很少有能挖掘出含有间接依赖的过程模型,本文用行为轮廓关系来表示任务间的间接依赖关系,给出了拟间接依赖的概念,从而提出了一个能有效挖掘含有间接依赖的过程模型的过程挖掘方法。本文提出的基于拟间接依赖的过程模型挖掘方法,以Petri网及事件日志相关知识为基础,把行为轮廓融入其中,依据行为轮廓建立初始模型;然后基于增量日志和拟间接依赖关系调整模型;最后根据评价标准选出最优模型。此方法特别适用于挖掘含有间接依赖的过程模型。(2)针对当事件日志中所含日志轨迹或任务数量过多时,挖掘过程比较耗时这一问题,本文以Petri网及事件日志的行为轮廓为基础,提出基于模型合并的过程挖掘方法。首先,根据各个日志的行为轮廓分别建立子模型,找出子模型的最大匹配域进而根据域行为轮廓合并最大匹配域得到初始合并模型,然后再根据日志的行为轮廓把剩余的变迁插入到合适的位置得到最终挖掘的模型。该方法把匹配域看作一个整体,大大简化了建模过程,提高了建模的效率。通过分析建模实例,验证了本文所述方法的可行性。