论文部分内容阅读
工作流是一类能够完全或者部分自动执行的经营过程,根据一系列过程规则,文档、信息或任务能够在不同的执行者之闻传递、执行,实现了业务过程的自动化集成和管理。
传统的工作流建模通常由领域专家根据企业工作流文档,或咨询流程参与者来定义模型。这种方法主要依靠建模者的主观经验,产生的模型有可能不是企业实际需要的工作流模型,而且具有效率低以及成本高的缺点。
工作流挖掘技术能克服传统工作流建模方法的缺点。工作流挖掘采用数据挖掘思想,通过工作流挖掘算法自动的分析工作流日志推导出企业的工作流模型。
目前的工作流挖掘算法主要分为两种:形式化挖掘算法和启发式挖掘算法。形式化算法是通过形式化的方式从工作流日志中推导工作流模型,以Aalst的α算法为代表;而启发式算法通过启发式规则推导日志中活动间的基本逻辑关系,建立工作流模型,Ricardo等的概率挖掘算法是这一领域中近几年来最有影响性的成果。
Ricardo的概率挖掘算法不能挖掘循环模式,但是循环模式是工作流模型中的基本模式之一,所以本文扩展了Ricardo的算法,通过对日志进行预处理的方法加入了对循环的处理。同时,使用Petri网作为工作流模型的表示手段,以便于下一步工作中对模型进行各种分析。接着用一个实例说明整个算法的执行过程,并且通过实验验证了算法的正确性。