中医小儿肺炎辩证标准数据挖掘系统中的数据预处理技术

来源 :东北大学 | 被引量 : 0次 | 上传用户:angelleosy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的飞速发展,存储在数据库中的信息呈指数级增长。人们希望从存储的大量信息中发现隐藏在数据背后的,有价值的知识。传统的数据分析和查询方法已不能满足这个需求。在这种社会需求的强劲推动下,数据挖掘技术得到了飞速发展。目前,数据挖掘技术已经成功地应用在社会的各个领域中,包括金融、医疗、科学、工业等等。数据挖掘技术是一门针对性很强的学科,依据所应用的领域的不同,通常会采用不同的策略和方法。在数据挖掘技术中,数据预处理技术占据着很重要的位置,是能够挖掘出有用知识的前提。 中医是我国古代劳动人民留下的宝贵的财富。中医辩证是中医学中的精华,是中医诊断学的主要研究内容。目前的中医辩证还没有一个统一的标准规范,这限定了中医学的进一步发展。为解决这一问题,本课题组与辽宁中医学院合作,以中医小儿肺炎为例,建立了中医小儿肺炎病例数据录入系统,收集了大量的数据,并利用这些数据,运用数据挖掘技术,试图挖掘出小儿肺炎的证和症状的内在规律,以建立客观的中医小儿肺炎辨证规范。该项目为国家科技部“十五”攻关项目“中医药疗效及安全性基本问题研究”,课题名称为“以小儿肺炎为示范建立辨证规范及中医疗效评价方法体系的研究”。 本文以该项目为背景,主要阐述了数据挖掘技术中数据预处理技术及其在中医小儿肺炎辩证规范数据挖掘系统中的应用。本文首先论述了数据预处理技术所包含的内容,在数据挖掘技术中的重要性,数据预处理技术中涉及的算法,接下来分析了中医小儿肺炎辩证规范数据挖掘系统中数据源的特点,并针对该数据源的特点进行了数据完整性处理、规范化处理、不可靠信息处理及属性约简。针对以往采用粗糙集方法进行属性约简得到的约简子集不能保证得到最小子集的缺陷,着重探讨了一种新的属性约简方法,即将粗糙集理论和蚁群算法(ACO)相结合,基于粗糙集的ACO属性约简算法RACO算法进行属性约简,达到输出最小属性子集的目的。
其他文献
随着我国城镇住房制度改革的不断推进,住宅逐步进入市场,居民的择居自主性也不断增强。自2000年以来,上海住宅市场蓬勃发展,市场上的住宅需求也处于不断上升之中。市中心区高昂的
超短回波时间(UTE)脉冲序列可激发短T2成分并在其衰减之前快速采集其信号,它是直接显示短T2成分的一种成像方法。综述UTE脉冲序列成像的原理及其显示组织内短T2成分的优势,并介绍
目的探讨MRI检查不同脉冲序列对胰腺病变的诊断价值。方法对87例临床怀疑胰腺病变的病人应用3.0TMR设备进行检查,扫描序列包括双回波T1WI(同相位与反相位成像)、脂肪抑制T1WI(T1
慢性胰腺炎是指胰腺不可逆的、进展性的慢性炎症,最终导致胰腺形态和功能损害。近年来,随着功能影像学的不断进步,在提高慢性胰腺炎诊断准确率的同时,对该病早期或轻型病例的
炎症性肠病病因复杂,目前认为主要与4个方面有关:基因遗传、免疫功能缺陷、屏障功能障碍、微生物菌丛.结肠CT不仅能较为出色地显示结肠黏膜,而且能够显示结肠壁及结肠周围结