论文部分内容阅读
过程挖掘技术是近几年国内外研究的热点和焦点,它的主要目的是从事件日志中挖掘出过程模型,并发现事件日志中隐藏的有价值的客观信息,从而帮助企业分析现存业务中存在的不足并加以改进,进而实施新的业务过程。而挖掘算法的好坏直接影响着挖掘结果的优劣程度,同时在企业应用过程中对企业的决策者产生重大的影响。因此挖掘算法在过程挖掘中占有很重要的地位。 本文首先研究了过程挖掘和工作流领域的基本理论知识,并比较当前存在的经典挖掘算法的优劣性,然后针对过程挖掘中的噪音和循环问题进行了分析,选择以α算法为基础进行改进,使得改进后的新算法能够较好地处理噪音并解决循环问题。本文的创新点如下: (1)对噪音问题的处理。本文引进了Agrawal提出的方法,他们对噪音出现的原因以及去除噪音的理论依据做出详细的分析说明,与此同时给出确切的阀值来处理噪音,并给出充分的理论证明,把此方法与α算法相结合,在挖掘过程模型的同时并去除了小于阀值的活动数,从而达到处理噪音的目的。 (2)对循环任务的挖掘。本文研究了循环结构在事件日志中的存在形式以及表达方式,并根据循环结构的特点加入到因果关系的表达式,进而使之融合到α算法中,这样改进后的α算法可以对事件日志中含有的循环结构进行挖掘,从而达到发现循环任务的目的。