论文部分内容阅读
近年来,随着业务流程管理技术的不断成熟,越来越多的企业使用特定的或通用的业务流程管理系统进行业务管理。业务流程管理系统与它们所支持的业务流程紧密结合,记录了大量反应业务流程执行状况的事件日志。这些日志蕴含着丰富的知识信息,可以用来指导和优化新的业务流程执行。虽然事件日志中蕴含着与流程执行状况相关的信息,然而,如何有效地获取并运用这些信息,目前尚存在以下挑战:首先,由于非结构化业务流程在执行时产生的实例具有复杂多变的特性,很难使用传统的挖掘技术从这类流程的事件日志中获取有价值的信息;其次,业务流程在运行时往往需要分配合适的人力资源(员工或执行者)。考虑到员工之间可能存在的协作属性,如何度量员工的协作属性并合理进行员工分配对提升流程的执行效率具有很大意义;最后,对正在执行的流程实例执行结果进行预测监控时,如何学习得到更多的影响流程执行结果的特征、并使用性能较好的方法进行预测也是目前预测性流程监控领域亟待解决的重要问题。本文针对上述问题,首先提出了基于轨迹对齐的协作模式挖掘方法;然后针对两种不同场景的员工分配问题,分别提出了基于实体协作模式的员工分配方法和面向复杂业务流程的协作最优员工分配方法;最后,提出了基于深度学习技术的流程结果预测方法。本文的主要工作如下:(1)针对非结构化业务流程难以分析建模的问题,提出了一种基于事件日志的层级协作模式挖掘HCPM方法。HCPM方法首先将历史执行的流程实例转换为融合活动和资源信息的实体轨迹,通过实体轨迹对齐得到对齐矩阵;然后根据不同的活动名称将其划分成多个活动块,并得到活动块序列;最后使用活动支持度阈值和实体支持度阈值分别过滤活动块序列和实体序列得到活动协作模式(即第一层协作模式)和实体协作模式(即第二层协作模式)。在模拟合成的事件日志数据集上使用HCPM方法,表明该方法挖掘得到的协作模式与预先设定的实体发生概率保持一致,从而验证了该方法的有效性。(2)针对如何根据事件日志获取员工资源的协作属性并实现员工资源分配的问题,提出了基于实体协作模式的员工分配方法。该方法通过定义实体协作度来度量两个员工在协作执行不同活动(即不同上下文环境)时彼此之间的协作能力,提出了基于挖掘得到的高协作模式快速分配员工的方法FOSA。FOSA方法通过定义两种编码可以快速匹配得到能作为候选分配方案的分配模式,并可从中选出一种能使得整个流程的协作度达到最大的分配方案。实验结果表明,本文提出的基于实体协作度比基于员工协作度进行员工分配的方法的有效性更高,而且FOSA方法与其他分配方法相比在有效性和效率两方面表现更佳。(3)针对如何根据员工资源的协作属性在复杂业务流程中实现协作最优员工分配的问题,提出了基于关键路径的复杂业务流程协作度度量方法。进一步,提出了两种员工分配方法:基于贪心思想的启发式方法GHSA和基于A*算法的启发式方法A*SA。其中,GHSA方法通过使用启发式规则给每个活动分配能取得当前协作度最大(即局部最优)的员工。A*SA方法则是通过使用估值函数对正在分配的方案进行最大协作度估计,然后根据其结果将这些方案按照优先级从高到低进行遍历,同时根据当前已知的协作度下界值对这些方案进行剪枝,直到找到一种协作最优的分配方案。基于真实数据集和合成数据集上的大量实验表明了上述两种方法各自的特性与优势。(4)针对传统的基于事件日志的流程结果预测准确性和效率不高问题,提出了一种基于注意力机制的双向LSTM神经网络构造分类器方法Att-Bi-LSTM。Att-Bi-LSTM方法首先通过双向LSTM神经网络自动获取历史流程实例中每个事件及其上下文信息中影响流程结果的特征,然后通过使用注意力机制将这些特征根据其影响程度分配相应的注意力值(权重参数),最后得到所有特征的加权和表示,并根据这一特征总和及实例对应的流程结果类型构造预测分类器,从而实现实时高效的流程结果预测。同时,还提出了其他三种用于实验对比的分类器构造方法:基于LSTM神经网络的方法LSTM、基于双向LSTM神经网络的方法Bi-LSTM和基于注意力机制的LSTM神经网络方法Att-LSTM。基于真实数据集上的大量实验表明Att-Bi-LSTM方法在实时预测的准确性、及早性和效率方面具有一定的优势。