决策树算法及其在冠心病诊疗中的应用研究

来源 :大连海事大学 | 被引量 : 5次 | 上传用户:sunnywwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来冠心病以其高发病率、高致死率的特点,给国人带来了健康威胁与经济负担。发展迅速的计算机技术为探索蕴含在中医诊疗数据中的疾病防治规律和用药知识提供了技术基础。如何从已有的数据中挖掘到这些规律和知识,以及如何对这些规律和知识加以利用来为冠心病中医诊疗提供辅助决策将是本文要研究的主要内容。决策树算法结果表达直观易理解。为了直观地反映冠心病症状与证候之间的关系,本文以多值属性多类标决策树算法为研究对象,针对该算法在冠心病中医诊疗数据处理过程中出现的问题进行相应的改进,并通过实验证明了改进的有效性。具体研究工作如下:第一,原有的多值属性多类标决策树算法在分裂属性选取的过程中会忽略掉当前属性取空值的数据。冠心病数据具有多缺失值的特点,原算法会大量丢失数据,从而使分类准确率相对较低。针对这个问题,本文对算法属性选择进行了改进,增加了对空值的判断,并将当前属性值为空的数据作为新的子结点,从而保证数据不丢失。第二,若数据中出现过多的空值属性,按照上述方法处理时容易出现过拟合的现象,造成决策树规模过大,模型分类准确率不高的问题。针对这个问题,本文在建树之前引入空值数目阈值,并根据该阈值对数据集进行预处理,排除掉空值数目过多的数据,这样分类准确率下降过快的问题得到解决。第三,在分裂效果评价阶段,本文提出了新的相似度计算公式,使类标集之间的相似度计算更加合理,并且公式中的参数能够反映集合之间的特征,根据这个特征自动调节。第四,实际应用方面,本文设计了一个辅助诊疗系统,系统中应用了上述改进后的算法。根据选定的症状来对中医证候进行预测,得到患者的中医诊断结果供医生参考。另外,系统中分类模型的训练集能够实现动态增加,在系统之上能够扩展出用于不同目的的专题挖掘子模块。
其他文献
减少配电线路故障跳闸一直以来是供电企业面临的一个难题,它牵扯到配网工程的各个方面,由于配网直接面对着电力客户,配电线路运行的好坏.直接关系到电力客户供电可靠性水平,配电设
水利枢纽工程,是一个具有多种建筑物,集各种效益于一身的综合性工程,工程的复杂性,使其在建设施工过程中,质量控制成为难点之一,本文通过浅析某水利枢纽工程施工监理中的质量控制,阐
河南省是农业大省,粮食产量高,对国家粮食安全贡献大,同时,河南省其它各类农产品的生产和消费总量也在全国占据很大的份额。因此,大力发展河南省现代农产品物流,对于优化其农
文章认为钱学森山水城市理论的发展可以分成 :1.思想孕育阶段 ;2 .概念形成阶段 ;3.理论发展和推动实施三个阶段。
<正>四月初,雅居乐雅生活服务股份有限公司(03319.HK)两大动作再次引起行业内关注,一是以2.05亿元收购了南京紫竹物业51%的股权,二是与兰石集团达成战略合作。此前,雅生活集
详细解释了四元数法中各元素的含义以及线性化函数模型的具体推演过程,提出了利用该方法解算坐标转换参数的算法步骤和参数的转换精度评价。利用实际工程构件的已知的两套坐标数据对四元数函数模型进行验证,通过对比转换后坐标与已知坐标可知,精度满足要求,方法可行。
版权商品的平行进口是一个比较棘手的问题,它涉及到版权贸易的问题.由于至今尚没有统辖平行进口的国际公约,各国仅依其国内立法及贸易政策来处理版权商品的平行进口问题.在传
近代云南口岸贸易变动的总趋势是在波动的过程中实现贸易的增长,这也是蒙自、思茅、腾越各口岸贸易变动趋势的共同特征。但是,在增长幅度、变动程度、进、出口贸易对总贸易趋
深基坑在高层建筑工程当中具有着非常重要的作用。深基坑工程主要针对的是高层建筑的地下室工程。施工企业必须全面重视深基坑支护施工技术的应用以及要点,才能够有效保证高