【摘 要】
:
目前,大多数的企业管理应用软件都会随着系统运行自动产生大量的日志,这些日志记录了系统的实际业务执行情况等信息。如何合理地对这些日志进行分析,提取有用的知识,成为近年来不
论文部分内容阅读
目前,大多数的企业管理应用软件都会随着系统运行自动产生大量的日志,这些日志记录了系统的实际业务执行情况等信息。如何合理地对这些日志进行分析,提取有用的知识,成为近年来不少学者研究的热点。
本文首先介绍工作流挖掘的意义及其技术研究的现状,并对流程挖掘技术面临的挑战进行综述,指出当前大部分的研究忽略了日志中的时间因素,并且没有考虑日志的流程增量问题,降低了对业务日志进行流程挖掘的准确性。基于当前流程挖掘研究的不足,本文提出了日志时态分析模型,利用该模型对日志进行预处理,首先对日志中的流程实例和各个任务进行时间分析,利用“时间区间划分法”建立任务间的时态关系,然后提出“时间知识权值法”对日志进行处理,删除一些无效的任务,有效地解决流程增量问题,提高流程挖掘的准确性和挖掘结果的参考价值。
在此基础上,我们提出改进遗传算法的时态流程挖掘框架,该算法在初始种群时引入启发式规则,缩小搜索空间。一个种群包含若干个遗传个体,每个遗传个体对应一个流程模型,遗传个体的适应度函数衡量遗传个体与任务日志的拟合程度。算法的适应度函数加入了微调因子提高流程挖掘的准确性,并且在变异算子中加入启发式规则,加快算法运算速度。在得到最优化个体后,使用合并技术构建时态流程模型。
最后,我们基于上述的讨论,在Java平台上实现了基于改进遗传算法的时态流程挖掘框架,通过实验进行检验分析,并与其他算法进行对比,证明算法的有效性,能克服α算法和α++算法在某些结构的不足和限制,并有效地解决一些流程增量问题,挖掘得到合理的时态流程模型。
其他文献
进入Web2.0时代以来,互联网发展迅速,各种网站层出不穷,其中恶意网站作为一个安全隐患,其危害性也越来越凸现出来。根据报告统计,我国的恶意网站现状更是不容乐观。恶意网站
专有名词识别是中文分词技术必不可少的基础环节,也是中文信息处理任务的关键。因此,专有名词识别对提高网络信息检索、文本分类、语音识别和机器翻译等重要领域的研究有着重
近些年来,虚拟化技术日益成熟,推动了云数据中心的快速发展。云数据中心能够高效地为租户提供CPU、内存、存储等硬件资源。在网络方面,现有的云数据中心多采用树型网络拓扑,
In recent years, Vision Systems have found their ways into many applications.This includes fields such as computer graphics, medical, industries such asassembly
从上世纪六十年代起,随着大型软件的快速发展,人们对软件质量的要求起来越高,尤其是对软件的正确性要求。计算机界为确保软件质量尤其是软件的高可靠性方面提出了许多新的理
移动机器人路径规划是一个很复杂的问题,不仅要寻求一条无碰撞的最短路径,而且还要求该路径尽可能平滑并满足一定的安全性。本文在分析了目前各种路径规划方法优缺点的基础上
随着数字技术和网络技术的快速发展,数字视频在人们生活当中越来越普及,人们能够方便的使用手中的设备拍摄、编辑数字视频。网络上也涌现出大量的在线视频观看网站,大型的视
由于拍摄环境中光线条件差等原因,低亮度视频中存在着大量的噪声、对比度较低的问题,这给人们的观赏和分辨带来了许多困难。本文通过借鉴知名的非局部平均滤波(Non Local Mea
本体的构建离不开工具的支持。随着本体在人工智能、语义互联网、电子商务、信息检索和抽取等领域的广泛应用,本体已经成为现在的一个研究热点,涌现出了许多本体构建工具。各
改变传统应试阶段学生处于盲目、被动的局面,利用先进手段,提高应试者的兴趣和学习积极性,通过交流互动,开展讨论,快速掌握基本考试内容和相关知识,充分调动学生的主观能动性