论文部分内容阅读
随着信息技术的快速发展,数据库技术被广泛的应用于企业、政府和科研等方面。如何从这些数据库中存储的大量数据中获取用于支持决策的有用知识,成为研究人员需要解决的问题。关联规则挖掘技术就是从海量的数据中挖据出潜在的、有意义的联系和规则。然而,传统的Apriori所代表的基于置信度、支持度的关联规则算法,通过连接步和剪枝步产生频繁项,再从频繁项集中生成关联规则的方式在实际应用中效率较低,因此对于传统的关联规则算法效率上的改进依然是该领域的重要问题。本文对传统Apriori算法及其不足进行了研究,通过传统Apriori算法与LMApriori算法的对比,LMApriori算法的时间效率更高,运用该算法获取糖尿病药物间的关系,用于构建糖尿病药物治疗本体。我国糖尿病患者的数量位居世界第二,糖调节受损者(潜在糖尿病患者)大量存在,糖尿病发病率高达9.7%,患者人数接近1亿,这一切表明糖尿病爆发的流行性趋势并未结束,如何利用信息技术为糖尿病药物治疗提供辅助支持也是目前研究的热点问题,本文将关联规则挖掘技术和本体理论相结合,利用LMApriori算法获取到的糖尿病概念间的联系,实现糖尿病药物治疗本体的半自动化构建,在所建立的糖尿病药物治疗本体上进行推理,从而辅助糖尿病的药物治疗;最后,利用Protégé自带的推理引擎对构建的糖尿病药物治疗本体进行检验和推理,验证了该模型的可行性,从而为糖尿病药物治疗工作提供辅助支持。本文的研究意义是采用一种高效的LMApriori挖掘算法,将其运用于糖尿病药物治疗的规则获取中,为糖尿病药物治疗本体的半自动化构建提供一种新的思路和方法,同时通过为确诊的糖尿病患者改进、制定药物治疗方案,来辅助糖尿病患者的药物治疗工作。本文的主要研究成果如下:1.针对传统关联规则挖掘算法时间和空间上效率不高的问题,采用一种基于标签矩阵的关联规则挖掘(LMApriori)算法,该算法的挖掘过程只需要对数据库进行一次扫描,并且不会产生候选项集,在时间和空间上都使得知识获取效率得到了提升。2.本文将关联规则挖掘技术和本体理论相结合,利用LMApriori算法获取到的糖尿病概念间的联系,实现糖尿病药物治疗本体的半自动化构建。3.在所建立的糖尿病药物治疗本体上进行推理,从而辅助糖尿病的药物治疗。4.利用Protégé自带的推理引擎对构建的糖尿病药物治疗本体进行检验和推理,验证了该模型的可行性,从而为糖尿病药物治疗工作提供辅助支持。