基于日志的业务流程分解与挖掘方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:meteora5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化时代,互联网的快速发展大大改变了人们的生活,人们的生产活动大多都在互联网上进行备案,产生相对应的业务流程信息。对于企业来说,对业务流程进行分析可以获取企业日常行为信息的执行情况以及发生异常的背景,以对企业内部工作结构进行调整和优化。流程挖掘技术既可以利用日志信息达到这一效果,通过对事件日志的处理,使日志中的信息可以尽可能完整的展现在挖掘出的流程模型中。然而在大数据不断发展的今天,人们日常接收到的数据呈爆炸式增长,企业内部也大量记录了用户相关的信息。流程挖掘技术在应用于大型事件日志时,在计算需求和生成输出的可解释性方面都存在可伸缩性问题,因为从大型事件日志中发现的流程模型通常提供的见解往往有限,产生的模型通常会具有低精度与低适应性的问题。为解决上述问题,比较常见的解决方法是将流程分解为各个阶段,每个阶段进行单独的流程挖掘,建立单独的业务模型。最后再将子模型进行合并,形成最终的业务流程模型。基于此背景,本文研究了基于日志的业务流程分解与挖掘方法。针对流程分解准确度低的问题,文章创新地提出了一种基于图聚类的流程分解方法。该方法使用最大流算法选出候选分割集,并通过最大化模块性差异的方式进行模块聚类,获得分块的活动集合,实现更加接近人工分割的效果。由于连接更加紧密的活动被分为同一阶段,分解结果在现实含义上也更加具有解释性。针对挖掘后的模型复杂度高,精确度低的问题,文章给出了基于子流程集的流程挖掘方法。首先,将子流程集构建成基于时间的并行流程图,其次,对挖掘出的子流程模型进行按照顺序的聚合和化简,最后,根据业务流程信息对流程模型细节进行完善,形成最终的业务流程模型。在实验验证部分本文对于流程分解和基于分解的流程挖掘两部分都进行了详细的分析,通过与生成平滑模型的挖掘算法和同样基于分解的挖掘算法的对比,验证了本文提出的基于图聚类的流程分解算法以及基于分解的流程挖掘方法的有效性。
其他文献
数据量的爆炸性增长以及数据生产范围的急剧扩大,对数据挖掘分析任务提出了更高的要求。随着网络的发展,当前的信息网络是由成千上万的实体通过相互连接而形成的,反映了实体之间的相互作用。目前,信息网络已经成为人们生活中不可或缺的一部分。而网络作为一个强有力的工具,能够清晰显示复杂系统内实体间的依赖关系,还能从宏观整体层面反映系统的运行情况,可以利用这些信息维护系统的安全,指导系统未来的发展等。本文的研究选
随着经济的发展和社会的进步,城市交通不断完善,汽车的自动驾驶和辅助驾驶系统应运而生,该类系统不可或缺的就是车道线检测技术。目前有很多传统的方法通过人工选择特征来进行车道线检测,但是这类方法只能处理简单的驾驶场景,而且检测速度较慢。为了提高模型的准确率和检测的速度,很多研究人员引入了深度学习的方法,针对目前车道线检测问题存在的难点与挑战,本文展开的研究工作内容如下:本文针对复杂的道路场景,对传统的空
[目的]研究深圳梧桐山不同树势毛棉杜鹃根际土壤理化性质和微生物多样性,探明毛棉杜鹃树势退化与根际土壤理化性质和微生物群落结构间的关系,为保障梧桐山毛棉杜鹃种群更新和演替提供理论支撑.[方法]采用抖落法采集不同树势(优、中、劣)毛棉杜鹃根际土壤,测定土壤含水量、pH和有机质、全氮、碱解氮含量;提取根际土壤DNA,利用高通量测序技术分析微生物群落结构及多样性.[结果]3种树势毛棉杜鹃根际土壤理化性质无显著差异;所有土壤样品共检测出细菌有效序列681807条,平均每个样本产生79898条有效序列,聚类为2008
基于稳态视觉诱发电位(steady-state visual evoked potential,SSVEP)的脑-机接 口系统(brain-computer interface system,BCIs)是一.类主流脑-机接口系统。它能够以较低的软/硬件成本实现无创、高信息传输速率(information transfer rate,ITR)的脑-机直接通信,因此成为BCI领域的研究热点。但受限于人
河南省是产种用种大省,但并非种业强省.河南省加快种业强省建设是扛稳国家粮食安全重任的必然要求.通过对目前我国典型种业企业先正达集团股份有限公司、袁隆平农业高科技股份有限公司、北大荒垦丰种业股份有限公司发展案例进行研究,分析总结相关成功经验和发展模式,探索出跨国并购、科技创新、人才队伍建设、产学研结合是河南省种业未来发展的方向和路径.