JT-WFB:流程检索算法公共评价数据集设计与算法分析

来源 :浙江大学 | 被引量 : 0次 | 上传用户:SnailHou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着业务流程技术的快速发展和广泛应用,用户可更高效的构建更新业务流程管理系统,从而积累了大量跨领域异构业务流程,根据参考流程检索出相似流程(流程检索)这一需求也日益迫切。国内外相关学者围绕流程检索或流程相似度计算提出众多方法,但却缺乏一个公认的标准来科学客观评价现有流程检索方法的优劣。论文首先对当前流程检索技术做了一个简要综述,分别介绍了主流的基于结构、行为以及语义进行流程相似度计算方法的工作原理,并对这些算法的局限性进行了分析。继而论文通过分析流程图的结构和特点,结合基于经验的流程相似度判断标准,基于IBM提供的公开流程库构建得到一个流程检索算法评价标准数据集(JTang Workflow BenchMark, JT-WFB)。数据集由检索流程以及基于经验判断的评价标准得到的目标流程及排序构成。通过对比分析不同流程检索算法的结果与实际人为观察结果的差异性,我们可以更好的判断哪种算法更适应于当前状况。最后,论文基于JT-WFB数据集分别实现关注点不同的典型流程相似度算法,参考不同评价参数分别分析各种算法检索结果的准确率,从时间复杂度角度分析不同实现方法的效率。实验表明,单纯考虑检索目标是否被检索到,基于余弦相似度的行为算法效果最好,考虑到检索结果的排序时,贪心算法的结果更佳,然而时间复杂度极高。
其他文献
人脸识别是基于生物特征的认证技术中具有挑战性的领域之一,也是本世纪有良好发展潜力的技术之一。作为自然而友好的身份识别方式,人脸识别已经成为模式识别和图像处理中的重
随着校园网规模的日益增大,新的网络应用类型不断出现,网络的管理也越来越难。信息化程度的不断提高给校园网的安全性、可用性、稳定性以及可扩展性提出了越来越高的要求。新
随着多媒体技术和网络技术的飞速发展,以视频压缩编码为基础的数字视频的应用也越来越广泛。运动估计是视频压缩编码的核心技术之一,能有效降低序列图像的帧间冗余,实现高效
目前,我国自主研发的铁路客票发售和预订系统已经十分成熟,可以方便的实现全国联网异地售票。随着IT技术的迅速提高、电子商务的不断普及,在我国出现了一些新颖的售票方式。
随着计算机技术的发展,软件产品已经渗透到人类生活的各个领域,在各种复杂的设备和系统中都有计算机在执行系统控制、状态监测等关键任务。因此,如何对软件质量进行有效的控
在很多流媒体应用中,音视频需要交织在一起编码、传输和解码,而且这样的应用往往在硬件资源相对有限的DSP (Digital Signal Processing, DSP)芯片上实现。为了在资源有限的DS
随着网络访问流量的迅猛增长和云计算技术的逐步推进,网络应用在多节点的情况下如何为用户提供一致性的服务变得日益重要起来。本文通过研究业界流行的Session一致性解决方案
随着互联网规模的增长和计算机技术的提高,用户对网络的需求也产生了相应的变化。宽带的普及和网络传输水平的提高使得高宽带多媒体应用成为可能。多媒体技术的发展与宽带的
服务组件架构SCA(Service Component Architecture)是一组规范,由IBM、BEA、Oracle、SAP等国外著名企业参加的OSOA(Open ServiceOriented Architecturel组织起草并规范。SCA
Mashup服务是一种将来源不同的Web API数据内容服务进行集成开发而形成的Web应用,是一种新型的Web服务。它从外界其他数据源得到数据内容服务,并将这些数据源的内容服务进行