论文部分内容阅读
数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘可以从海量的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识,能为管理者的决策提供科学、有效的支持。其中关联规则挖掘是数据挖掘中的重要分支,是目前应用最广泛的一种数据挖掘类型。 数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的,并可对数据库进行查询和访问,然后发展到对数据库的即时遍历。数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对过去的数据进行查询和遍历,并且能够找出过去数据之间的潜在联系,从而促进信息的传递。现在数据挖掘技术在商业应用中已经可以马上投入使用,因为支持这种技术的三种基础技术已经发展成熟。它也是近年来伴随人工智能和数据库技术的发展而出现的一种新型技术,从大量的数据中提取(或挖掘)出有价值的、隐含可信的、有效的信息的高级处理过程,该技术在国外主要用于信用分析、风险分析、客户关系管理及医疗分析等。在医疗行业,主要应用数据仓库的建立与分析、遗传性疾病自动检测、恶性肿瘤的诊断与恶性程度的判断分析、院内感染的分析、医学影像数据的挖掘及专家系统的建立等。 论文在研究关联规则挖掘技术的基础上,进行了基于关联规则的医疗保险数据的分析与挖掘。 论文首先介绍了数据挖掘技术的国内外研究现状,论证了采用数据挖掘关联规则对医疗保险数据进行分析与挖掘的必要性;其次概述了数据挖掘及关联规则的基本概念和基本理论,包括数据挖掘的概念、数据挖掘的过程及分类等,深入分析研究了经典关联规则Apriori算法;在此基础上提出并实现了Apriori改进算法,设计了关联规则生成算法,并通过实验数据对Apriori经典算法和Apriori改进算法进行了算法效率的比较分析;最后,将Apriori算法应用于某矿业集团的医疗保险数据中进行数据挖掘,对得到的规则进行了分析,为矿业集团完善医疗保险制度的运行提供了辅助的决策支持,具有较高的实用价值。 论文的研究成果已为某矿业集团的管理人员、决策人员深入了解影响医保费用金额、特殊病发生等有关因素,调整医保运行方案提供了有力的决策支持。