论文部分内容阅读
中医是中华民族的瑰宝,辨证论治是其之精髓。方剂是中医辨证论治的完整体现,它集中医之理、法、方、药于一体,是一个经历了几千年积累的庞大数据集合。数据挖掘是一种新兴的信息处理技术,能够自动地发现隐藏在数据中的规律或模式,并能处理海量数据。因此,数据挖掘也适用于方剂配伍规律的研究。它对于中医证型的识别、指导中医临床组方配伍,加速中药新药的开发,拓展中医药的生存空间和推进中医药的产业化和国际化进程具有很大的促进作用。
用数据挖掘方法研究中医,国内尚处于起步阶段。浙江大学、北京中医药大学、西安电子科技大学、成都中医药大学在这方面作了一定的研究,发现了一些值得深入研究的现象和模式。本论文在分析传统的关联规则和分类挖掘的基础上,重点讨论了类关联规则挖掘方法,它与传统的关联规则和分类方法不同。一个基于关系数据库的属性,对应着一个结果,构成属性与属性值之间的值对关系,所有这些值对关系的集合,组成整个类规则集,它能对关系数据库中的属性具有以分类为目的的预测能力。在此基础上,把类关联规则的研究成果应用于中医方剂配伍系统,挖掘中医感冒方剂的配伍规律。论文的工作主要从以下三个方面展开:
首先,对关联规则和数据分类进行研究,回顾了现阶段比较常用的关联规则及分类算法。基于 Jiuyong.Li 博士提出的挖掘最优类关联规则集的理论,论文在完成原算法程序设计的基础上,实现了对原算法的改进,得到挖掘最优类关联规则集的新算法。通过增强候选树结点的生成条件,更多的弱规则被剪枝,树增长的规模减小,减少了以后剪枝的工件量,从而获得更高的时间、空间效率。实验证明了改进算法的正确性和有效性。
其次,提出了挖掘最大频繁类关联规则集的概念和算法,实验证明它对数据的预测分类同样有效。
最后,将关联规则、分类、挖掘最优类关联规则集算法和挖掘最大频繁类关联规则集算法应用于中医方剂配伍系统,对感冒方剂配伍规律进行研究,论其“方-药-证”之理,得到了较为满意的结果。