基于信息熵和轨迹聚类的抗噪过程挖掘算法

来源 :上海大学 | 被引量 : 0次 | 上传用户:itsmoreaaron
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着工业智能化的到来,自动化生产越来越迫在眉睫,越来越多的企业开始在生产中使用业务流程管理系统。随着业务流程管理系统的运行,累积了越来越多的业务流程日志等数据,如何有效利用和分析这些事件日志是人们亟待解决的问题。过程挖掘技术是业务流程管理中的重要内容之一,可从事件日志中抽取过程知识,构建过程模型,有助于企业流程的检测并对其进行改进。本文通过调查过程挖掘技术在国内外的研究现状,梳理了其发展过程及具有代表性的过程挖掘算法,发现大多数过程挖掘算法在处理日志噪声方面存在不足,一些过程挖掘算法忽略噪声带来的影响,不具有客观性,而大多数可处理噪声的过程挖掘算法无法给出合理的去噪阈值。为了解决该问题,本文给出基于最大熵原则的去燥阈值方法,用于去除事件日志噪声对过程挖掘结果的影响,然而,此方法仅仅适用于稠密日志,因此,本文进行了优化,给出基于轨迹聚类的去噪方法,识别噪声轨迹。另外,本文在改进的频次矩阵的基础上,根据日志中的活动频次关系识别循环结构、选择结构、并行结构和非自由选择结构。最后给出了自适应去噪构建过程模型的算法。本文给出的算法是信息熵在过程挖掘领域中去除噪声的一种新的尝试。求得的去噪阈值参数不需人为进行设置,可根据事件日志自适应确定,因此给出的算法鲁棒性较好。最后,实验验证了本文提出的算法在挖掘含有噪声的日志时具有更高的拟合度、行为合理度、精确度与召回率。
其他文献
21世纪以来,随着经济、金融的全球化发展,大型企业、公司已经开始突破国界的限制,向境外资本市场上进军,而实现跨境经营是适应国际化环境的有效途径,可以提升自身实力以及其
聚类分析是数据挖掘的重要步骤之一,聚类分析能够初步探知未知数据的分布结构、属性特征,是一种无监督的数据分析过程。在信息社会飞速发展的今天,数据挖掘对于生产生活的指
经济的发展与全球市场一体化的趋势,使得企业的供应链日趋复杂化。市场竞争早已不再单纯是企业之间的竞争,而是供应链之间的竞争。而供应链管理中,库存管理已成为影响供应链
伴随着城市交通不断发展,汽车总量也在不断增多,智能化的交通管理是未来智慧城市建设的主要方向之一,而车牌识别技术是智能交通管理的基石。该技术可以应用到交通运输调度管
成簇的规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeats)/CRISPR 相关蛋白 9(CRISPR-associated protein 9,Cas9)系统作为第三代基因
目的:探讨长链非编码 RNA(long non-coding RNA,lncRNA)HOXD-AS2在胃癌中的表达情况,以及其在胃癌发生发展过程中所扮演的角色,对胃癌细胞生物学行为的影响和具体的调控机制。方法:(1)根据前期芯片结果,筛选出芯片中表达差异较大的HOXD-AS2,再通过实时荧光定量PCR(RT-qPCR)在79例胃癌组织和其对应的癌旁组织、胃癌细胞系及正常胃粘膜细胞中验证HOXD-A
伴随着虚拟现实技术的发展,各行各业都开始了对虚拟现实技术及其领域的探索,虚拟现实技术以一种新的体验方式打破了旧的呈现内容的方式。特别是在产品广告营销领域和游戏领域
以SiC、GaN等第三代半导体材料为基础的结型日盲紫外探测器件具有高量子效率,高响应速度以及高紫外可见比等优势,在军事及民用领域具有广泛的应用前景。而雪崩型紫外探测器应
随着经济的发展与科学技术的进步,轨道交通在生活中日益重要,而轨道的运行状态在保障列车行车安全中至关重要,如何高效、便捷的检测轨道状态成为铁路系统发展的重点,在线动态
复杂网络是描述和分析复杂系统的重要方法,广泛应用于不同的科学领域,例如,社会学、生物科学和计算机科学等,已经成为复杂性科学领域中重要的研究内容。近年来,几乎所有关于