脑卒中类型与复发的Logistic回归预测及SMOTE算法处理非平衡临床数据

来源 :河北医科大学 | 被引量 : 2次 | 上传用户:guanenyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:脑卒中是一种突然起病的脑血液循环障碍性疾病,居全世界主要死因的第二位,分为缺血性脑卒中和出血性脑卒中,两者的治疗方法大不相同,目前临床判断卒中类型最准确的方式是CT或MRI检查,但在未能进行影像检查的情况下,只能依据临床表现初步判断类型,较容易误诊。本研究拟通过已有的临床数据,构建脑卒中分型回归模型、脑卒中复发回归模型,用于临床辅助诊断及出院后的健康管理,并评价预测效果,希望能够为临床提供一种辅助诊断手段,提高诊断正确率。使用分类模型分类时需要有分布较平衡的数据才能获得良好效果,在多数类似的研究中,数据不平衡现象普遍存在,本研究引入了非平衡数据处理方法SMOTE(Synthetic Minority Over-sampling Technique)算法、随机复制法及欠抽样法,并对处理结果进行了比较。方法:获取石家庄市某医院因脑卒中入院治疗244例患者的病例及出院后健康监测数据并整理,通过IBM SPSS进行Logistic回归分析,方法采用向前法,变量入选水准入=0.05,出=0.10,获得构建回归模型所需参数,获得Logistic回归方程。若数据中出现类别分布不平衡的现象,导致分类预测准确率或灵敏度较低,则使用数据平衡方法平衡数据,随机复制过抽样法及随机欠抽样法均使用SPSS中的随机抽样功能选择,SMOTE算法则使用使用R语言DmWR程序包中的SMOTE函数调用SMOTE算法平衡数据,结果:1获得了脑卒中分型的回归模型,其预测准确率较高。脑卒中分型回归模型Cox&Snell R Square检验拟合优度为0.634,预测准确率为86.1%。2得到了脑卒中复发预测的回归模型,其预测灵敏度较低。缺血性脑卒中复发回归模型Cox&Snell R Square检验拟合优度为0.236,其灵敏度为28.6%。出血性脑卒中复发回归模型Cox&Snell R Square检验拟合优度为0.272,其灵敏度为60%。3得到了使用SMOTE算法、随机复制过抽样法及随机欠抽样法平衡数据后缺血性脑卒中复发回归模型的预测数据及ROC曲线。其中随机复制过抽样法处理获得的回归模型Cox&Snell R Square检验拟合优度为0.473,灵敏度为85.7%;随机欠抽样法处理获得的回归模型Cox&Snell RSquare检验拟合优度为0.576,灵敏度为85.7%;SMOTE算法处理获得的回归模型Cox&Snell R Square检验拟合优度为0.488,灵敏度为89.3%。经卡方检验三种方法的灵敏度无显著差异。ROC曲线下面积中SMOTE算法大于随机过抽样法和随机欠抽样法。结论:1缺血性与出血性脑卒中类型可以使用Logistic回归进行辅助诊断,以提高诊断准确率。根据回归式可知血压的升高对发生出血性脑卒中有较大影响,而TIA史与出血性脑卒中呈负相关性,在脑卒中患者中,经常运动的人患脑出血的可能性更高,有脑卒中家族史的患者患脑出血的概率较高。2脑卒中患者的复发可以根据出院后对其健康检测的数据代入Logistic回归方程评估,若P<0.5则归类为不复发,若P≥0.5则归类为复发。获得结果后可对被判断为复发组的人群进行强化健康管理。3在研究非配对样本类别问题时,必须要重视不同类别样本的平衡性,若不同类别样本量不平衡,极易使得研究结果更倾向于样本量大的类别,产生偏倚。综合随机复制过抽样法、随机欠抽样法及SMOTE算法原理、预测灵敏度及ROC曲线,SMOTE算法即避免随机复制过抽样法产生的过度拟合,亦防止随机欠抽样法导致的信息缺失。SMOTE算法平衡数据优于使用随机复制法及随机欠抽样法。
其他文献
污染触目惊心的可怕rn(The host) 2007韩国rn2000年,驻韩美军医院的一名美国医生下令一名韩国医生将大批闲置的剧毒甲醛倒入卜水沟流入汉江.2002年,在汉江钓鱼的两个人发现水
~(14)C-多菌灵用硫脲法标记合成,产率51%,含量99%,产品达到放化纯。~(14)C-多菌灵示踪研究表明:水稻叶片和根系均能吸收,并运转积累于植株各部分。~(14)C-多菌灵及其代谢产物
结直肠癌(CRC)是一种常见的消化道恶性肿瘤,发病率与死亡率均呈逐年上升趋势,已然成为影响人类健康的重要疾病。目前CRC的主要治疗手段为外科手术,但术后仍有一定比例的复发
课堂教学改革始终处于教学改革的重要地位,但是,要做好这项工作却又不单单是课堂上的改革,它的保障制度、配套制度等都需要改变和完善。近年来,滦南县紧紧围绕课堂教学改革,
红花(Carthamus tinctoriusl L.)属菊科一年生草本植物,是一种古老的栽培作物,为向日葵的近缘植物。由于红花种子含油量高达32—44%,含蛋白质18—24%,且其脂肪酸组成则多以不
视觉文化传媒时代,电视作为传统的大众传媒工具,紧随时代发展的脚步,以先进的技术手段与创新的组织管理理念进行自身变革。本文试以现行的电视媒介组织管理体制的管理理念为
以生为本,立足学生发展,将先进的教学设备与教学理念相结合,把学习变为活动,把课堂变为学堂,创设让学生能够跟上时代发展的现代化课堂,是唐山市滦南县在落实新课程改革过程中
碱谷又名(禾参)子,龙爪稷。学名Eleusine coracana(L.)Gaertn。禾本科,虎尾草族,(禾参)属(又称龙爪稷属),一年生草本植物。我们自1980年以来,在盐碱地上小面积种植试验,在施
太湖地区较大面积的免耕,大部分是浅灭茬5厘米,肥料混施于5厘米土层内.本文仅就免耕与常规耕翻的速效钾含量变化作比 The larger area of ​​no-tillage in Taihu Lake are
目的检测转录因子Fli-1蛋白在外周血T细胞与B细胞上的表达水平,分析其表达水平与系统性红斑狼疮(systemic lupus erythematosus,SLE)患者SLE疾病活动度、临床实验室指标及临床表