基于关联规则的2型糖尿病相关危险因素研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:JoanFang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着医疗卫生事业的迅速发展,医疗卫生数据库中存贮的海量医疗信息数据成为人们研究的热点。这些数据都是与人们生命健康息息相关的载体,对疾病的诊疗和预防有着重要的意义。然而传统的数据库技术,仅仅只能够针对实时数据进行简单的查询、修改、录入、删除等基本操作,若想要从这些数据中获取隐含在其中的医学规则,传统的数据库技术很难办到。  在此背景下,本文着重研究了目前数据挖掘与知识发现的主要研究内容之一——关联规则。它侧重于确定数据中不同属性之间的联系,找出满意约定支持度(Support)和信任度(Confidence)阈值的多个属性之间的依赖关系。自1993年R.Agawal,R.Srikant首次提出该问题来,已经出现了许多关联规则挖掘算法。本文研究了关联规则算法中的经典算法Apriori算法,并结合前人的研究基础,提出了一种Apriori算法的改进办法。  接着,本文运用数据挖掘中的关联分析方法和SPSS Clementine12.0软件对医疗信息数据库中的二型糖尿病患者数据进行多维度、多层次的分析,得到的结论可以用于辅助医生和二型糖尿病高危人群量化判断决策。  本文的工作主要分为以下几个方面:  (1)研究经典关联规则算法。研究当前主要关联规则算法Apriori算法,并分析总结Apriori算法存在的优势和不足。  (2)改进Apriori算法。研究前人改进Apriori算法的几种思路,分为:基于分片的方法、基于Hash的方法、基于采样的方法、减少交易个数的方法和基于模糊集的方法。在此基础上提出了一种改进Apriori算法的方法。  (3)对比分析。本文利用C#语言对Apriori算法和改进Apriori算法进行编程,并将两者做了对比实验,从频繁项集与支持度、运行时间与记录数、运行时间与支持度这三个方面进行测试,实验结果表明改进Apriori算法比经典Apriori算法更有效率。  (4)建立数据挖掘初始集。从某三甲医院医学信息中心获取的首次病程记录及居民健康数据档案中提取2型糖尿病的相关危险因素,并对这些数据做预处理,最后将它们做成Excel文本格式,作为数据挖掘的初始集。  (5)挖掘关联规则。本文应用SPSS Clementine12.0软件中的Apriori算法模型对数据初始集进行数据挖掘,得到了若干2型糖尿病相关危险因素与2型糖尿病之间的关联规则以及2型糖尿病相关危险因素之间的关联规则,并对这些关联规则做了分析。
其他文献
本论文是以编筘机作为应用背景。传统的编筘机是一台电机带动丝杠转动同时控制编筘时铁片送片的动作,而本文介绍了利用单片机分别控制两台电机完成控制丝杠和运送铁片的动作。
纱线的条干不匀已经成为衡量纱线品质的主要目标之一。纱线的条干不匀不仅对质量指标评定有影响,还将影响企业的经济效益。目前,测量纱线条干的上位机软件有的是基于Dos系统下
当今社会,人们越来越重视可再生清洁能源的开发和利用。在各种可再生能源中,生物质能具有多方面的优势,发展潜力巨大。气化是生物质能源转化利用的主要方式,因此,分析研究生
随着计算机技术、微电子技术以及相关技术的发展,嵌入式系统正在应用到越来越多的领域。在仪器仪表方面,以往复杂的控制和处理经常要求助于计算机,实现起来有很多不利因素。而嵌入式系统以其高性能,低功耗,低成本,小型化,灵活性等优点,为以上问题提供了很好的解决方案,同时也为数字测风经纬仪提供了技术基础。本文首先回顾了测风经纬仪的历史、国内外发展状况,以及普通测风经纬仪在使用上的不足。提出了基于嵌入式系统的新
随着通信和网络技术的发展,Ad Hoc网络得到了越来越广泛的研究和应用,同时,对Ad Hoc网络的研究也朝着大规模应用的方向在发展。然而,现有的Ad Hoc路由协议多是针对中小规模的
秸秆锅炉过热汽温控制系统是提高机组热效率和保证机组安全运行的重要组成部分,过热蒸汽温度的干扰因素很多、很频繁且扰动量很大,在各种扰动作用下,过热蒸汽温度动态特性具
随着复杂网络理论的不断发展,基于复杂网络的实证研究也不断深入,其中,基于科学家之间合作关系的科学家合作网络的性质分析也受到了一定的关注。人们对国外的一些大型科学家合作网进行了研究,以挖掘科学家之间的合作模式和发现他们的行为特征。本论文旨在研究中国科研工作者之间的合作关系,为此,选择了过去20年(1988-2007)发表在《科学通报》上的文章作为数据对象,构建了一个科学家合作网,对其静态性质和动态演
“神舟七号”宇航员成功出舱行走,是我国载人航天工程一个新的里程碑,是我国建立空间站迈出的第一步。但是太空环境极其恶劣,送宇航员到太空的成本高、风险大,而空间机器人安
网络控制系统是控制科学和计算机网络及通讯技术的综合应用。随着国际互联网在全球的飞速发展,网络中存在的使网络控制系统性能下降、甚至不稳定的时延日益受到研究者的重视
随着科技的进步和生活水平的提高,空调的普及度越来越高。但是人们对自己所居住环境的要求也越来越高。目前,空调并没有完全达到人们所期望的清新健康的居住环境要求,因此,空调系