【摘 要】
:
目前有很多针对正常与非正常案例甄别方面的研究,大多是研究如何人工建立区分标准或特征库,这类方法不仅使得前期准备工作量巨大,而且后期甄别能力有限,准确率也低,在很多应
论文部分内容阅读
目前有很多针对正常与非正常案例甄别方面的研究,大多是研究如何人工建立区分标准或特征库,这类方法不仅使得前期准备工作量巨大,而且后期甄别能力有限,准确率也低,在很多应用领域有着明显的局限性。机器识别是人工智能的一个重要研究领域,近年来在工业生产、医疗、金融等多个领域广泛使用,但前期的工作依旧是依赖于专家设定标准,这种标准由于无法摆脱人的主观性,而使得甄别准确率大大降低。本文首先介绍了有关甄别正常与非正常案例的研究背景和最近的国内外研究现状,之后介绍了流程挖掘和数据挖掘相关的基础知识。针对现有的甄别方法存在的不足和缺陷,在总结前人研究经验的基础上,本文提出了一个基于流程挖掘的甄别模型(the detection model of normal and abnormal instances, DMNAI)。该模型通过频繁模式发现来提取案例特征,使用神经网络分类器进行检测,从而避免了人工设定标准的主观性。本文立足于框架的研究,还将DMNAI模型与现有的用于医疗欺诈与滥用检测过程的流程挖掘框架(a process-mining framework for the detection of healthcare fraud and abuse, DHFA)进行了比较。由于在DHFA框架中,特征的选择只是机械的查表工作,使得该模型的泛化能力较弱。DMNAI模型通过流程挖掘来提取特征,建立了一个更为应用广泛的检测模型。实验表明,DMNAI模型经过现场实际数据的验证,能有效地自动化甄别非正常案例。论文最后,以网上购物流程为实例,对该模型进行检验分析,证明了该模型的可行性和准确力。
其他文献
随着信息时代的来临,人们在日常生活中获取的信息量与日俱增。如何在海量数据中选取对自己有用的信息,成为目前广大用户面临的主要任务。在此情况下,数据挖掘技术应运而生并
随着当前计算机技术的不断发展,特别是Internet技术的发展,文本信息的数量呈现爆炸式增长。如何帮助人们有效的获取自己需要的信息,成了信息处理领域一个亟需解决的问题。而
网络数据传输和处理能力的大幅度提高使得基于组播技术的多点间数据传输需求日益增加。网络编码理论是21世纪初在信息论和网络通信研究领域中的一个重大突破,而网络组播中的
优化技术是一种以数学为基础,用于求解各种工程问题最优解或者满意解的应用技术,任何控制与决策问题本质上都可以归结为优化问题。对优化问题的求解已有的经典优化方法,主要包括
随着信息时代的到来和多媒体技术的飞速发展,多媒体因其丰富形象的表现形式,已经成为信息数据的重要载体之一。在视频信息的大量涌现和迅猛发展的情况下,如何快速有效地处理
目前增强现实系统的应用越发广泛。在增强现实系统中,相机跟踪、虚实融合和人机交互是三大核心问题。当用户使用增强现实系统时,徒手交互是最自然的交互方式之一。然而当前手
1859年11月24日,英国生物学家Charles Robert Darwin发表了《物种起源》一书,提出了生物进化论学说。科学家们发现可以通过进化树来形象的展现物种之间所存在的遗传系谱关系
业务流程模型是一种反映业务流程执行过程的计算机化的模型,是为了能在先进计算机环境支持下实现运营过程集成与运营过程自动化而建立的、可由业务流程管理系统执行的业务模
目前,柑橘产量排在重庆所有种类水果中的第一位。要维护广大柑橘农户的利益,其关键就是提高柑橘的产量和品质。柑橘生长发育的基础是水分,柑橘园水分管理的好坏直接影响到柑
XML是W3C于1998年提出的一种标记语言,由于独特的技术优势,XML推出后很快就成为Internet上信息描述和交换的标准。随着XML应用的越来越广泛,Web上的XML文档与日俱增,为了实现