上下文环境下探测概念漂移的算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:WWL6612
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流程挖掘在社会日常生产工作中起到非常重要的作用。但是,由于当今市场的竞争和技术的升级,系统的流程会趋向于弹性化、灵活化。因此,需要感知系统流程变化和变化后的流程对于当前系统运作的影响,以及如何优化和控制变化后的物质资源和人力资源的分配。目前,在复杂的流程中很难通过人工的方式检测流程各个点的细小变化,此时需要一定的技术用来自动的动态监测复杂流程系统中流程的变化。通过检查流程的变化可以及时对整体流程做出调节、优化。当系统流程出现问题时,可以清楚的、方向明确地排查问题根源。在流程挖掘领域,这项技术称为“基于流程挖掘的概念漂移的侦测”。传统的流程挖掘领域中概念漂移算法大多对变化识别率低、算法复杂度高,更为重要的是没有应用到流程的上下文周边环境。流程上下文环境的应用将会是流程挖掘领域的下一个突破点。本文在原有的研究基础上,提出了一种新型的算法。该算法通过计算样本之间的结构属性(关联系数、关系熵、跟随矩阵),以及上下文属性(时间属性,人员属性),利用属性矩阵获得日志之间的距离,利用假设检验技术实现对样本的处理,发现流程运行中发生的概念漂移。算法出于时间复杂度的考虑,利用流程变化前后的稳定性,同时为减少对样本属性的提取与计算,通过先计算大日志块,然后逐步细化,最后将漂移点收敛至概念漂移发生的位置,从而侦测到概念漂移。另一方面,算法为了提高精确度,利用上下文环境中时间的变化和任务完成者的变化来提高算法对流程变化的敏感性。本文最后设计了相关实验对算法验证。试验结果表明,在日志规模在200、2000、20000的情况下,本文提出的算法均能发现所有的漂移点,并且不会出现参数误判现象;但是原始算法在200、20000日志规模情况下,会发生漂移的丢失或者误判现象。通过本文的论述和实验,本文提出的算法无论是在理论设计上,还是实验结果上,相对于已有的研究成果都有了不同程度的进步,从时间效率、精确度上均表现出了非常优异的效果。
其他文献
采用磁共振扩散张量成像(Diffusion Tensor Magnetic Resonance Imaging,DT-MRI,简称DTI)影像数据可以实现对脑部神经纤维束的追踪和可视化展现,为相关疾病的诊断、神经纤维束的手
视频监控是信息获取理论与技术研究的一个重要内容,也是计算机视觉理论与技术研究的一个重要方向,它能够提供直观、准确、及时和内容丰富的信息。因此,它具有非常广阔的发展潜力
多年来,指导信号采样的理论基础一直是著名的奈奎斯特(Nyquist)采样定理。定理要求信号的采样率不得低于信号最大频率的两倍,这给系统的处理能力带来了很高的要求,给相应的硬件设
据不完全统计,每年在世界各地举办的国际学术会议的数量达到了1万多次,参会人次也有百万之巨,学术交流活动日益频繁。而且,学术会议的种类繁多,特点复杂,有的是一次性的会议,有的则
随着计算机技术的迅猛发展,虚拟实验一直是计算机领域、教育信息化方向的研究热点。本研究以中职《计算机组装与维护》课程中硬件组装实验教学的不足为研究起点,通过设计与开
学位
随着英特网的不断发展,图像数量与日俱增,每天大量的图像都会被添加到图像数据库中,图像检索技术逐渐成为一个非常活跃的研究领域。如何有效地对这些图像进行分析、存储和检索已
农业信息化公认的难题是信息传递的“最后一公里”。在农业生产现场直接提供服务是提高农业服务效率和准确度的有力保证。基于移动网络的农业微博,可以方便地解决这一难题。利
随着计算机软硬件技术和现代测控技术的不断发展,自动测试系统的规模和复杂程度越来越高,使用传统的软件开发方法,特别是使用C语言这种面向过程的程序设计语言,难以在有限的的时
在计算机信息安全体系的建设过程中,身份认证占据重要的地位。如何提升企业内部各部门及移动办公人员访问企业内网数据的身份认证识别安全等级,已经成为网络管理员需要解决的重