论文部分内容阅读
提高医疗行为的标准化质量管理,杜绝不合理的资源使用及不规范的诊治流程,是当今医疗机构面对的热点问题。医学界提出了临床路径的管理理论指导病例诊治,针对单病种的监测、治疗、康复和护理,制定有严格工作顺序的、有准确时间要求的诊疗计划和流程,以期规范诊疗行为、资源的合理运用和促进医疗质量的提高。根据循证医学的指导原则,好的临床治疗方案,需要依靠客观可靠的数据和标准以及具体的分析评价方法来确定,同时对医疗行为的违规性分析也应依照科学的数据化度量标准。基于此,本文针对已有的医疗数据,利用数据挖掘的方法,构建数据处理模型,进行序列挖掘,发现隐含的合法临床行为模式结构及片段,为医疗行为管理以及违规行为的检测提供决策依据,具有重要的理论意义和实用价值。本文的主要工作如下:1.数据的预处理方法的研究。通过对原始数据加以属性规约,抽取和清理得到有效临床行为数据。针对清理后数据仍然存在时间关系噪音,直接用于序列挖掘算法难以发现高质量的模式的问题。设计一种时间规范化模型,该模型定义了时序行为的顺序和并列关系,进行关系相交系数的计算,根据计算结果确定行为时间关系中的噪音,遵循规范后的所有行为相互之间既无噪音又保持原正确关系不变的准则,进行噪音清除。2.结合数据挖掘对算法的格式要求和领域行为特点,区别于固定窗口大小的算法,提出一种小粒度、有持续时间约束的序列生成算法,允许临床行为跨窗口触发,产生顺序及并发相混合的序列模式,生成直接用于挖掘的序列格式。3.针对现有算法的不足,基于Apriori算法原理结合Spam算法策略和临床行为特性,提出具有持续性时间约束的序列挖掘方法SMDC。采用不完全字典树存储结构,通过深度优先策略扩展的生成候选模式。生成节点同时,动态构造新节点的种子。使用持续性时间约束的筛选候选集方法计数支持度:引入双支持度,二进制运算标志位实现计数子序列;引入节点合法性概念,使用时间约束关系对子序列进行序列合法性的判断,通过合法与非法节点的关系论述及各司其职,确保继续生成正确候选项,并计数符合临床行为标准的合法子序列的支持度,从而完成树节点的修剪。4.验证设计的数据挖掘算法,实现临床行为模式挖掘原型系统,对经过相应预处理的临床行为数据进行挖掘,通过评估与分析,说明模式的正确可用性。