基于机器学习的烟雾病缺血/出血转化模型及其危险因素分析

来源 :南昌大学 | 被引量 : 0次 | 上传用户:m6300
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:1.采用单因素分析,探讨脑卒中型烟雾病的临床特征;2.建立和验证烟雾病缺血性/出血性脑卒中危险因素的机器学习模型;3.比较六个机器学习模型的性能;4.采用联合三个机器学习模型共同的特征重要性排序与单因素分析结果相结合的方法,确定烟雾病患者缺血性/出血性脑卒中的危险因素。方法:采集南昌大学第二附属医院大数据库中2012年1月1日至2019年12月31日入院的确诊为烟雾病的患者相关资料(包括患者的性别、发病年龄、民族、长期居住地、医疗保险类型、住院次数、吸烟史、饮酒史、烟雾病家族史、高血压病史、糖尿病病史、入院时空腹血糖、血脂水平、血小板计数、受累血管及血管受累程度、Suzuki分期、合并动脉瘤、首次发作脑卒中的类型以及合并其它疾病等因素);根据入选标准和排除标准将入选的患者分为三部分,其中2012年1月1日至2017年12月31日入院的入选患者按7:3比例被随机分割为训练数据集和内部验证数据集,用于模型的构建和内部验证;并将2018年1月1日至2019年12月31日入院的入选患者作为模型独立的外部验证数据集,用于模型的外部验证;所有入选的患者根据首次发作的脑卒中类型被纳入脑梗死组和脑出血组。首先,采用单因素分析,比较2012年1月1日至2017年12月31日入院的入选患者的相关资料,从而探讨脑卒中型烟雾病患者的临床特征,并根据分析结果初步筛选烟雾病患者缺血性/出血性脑卒中的危险因素;再者,对所采集的训练数据集分别采用XGboost(extreme Gradient Boosting)、SVM(Support vector machine)、LR(Logistic regression)、MLP(Multilayer Perceptron)、RF(Random Forest)和NB(Naive Bayes)六种机器学习算法建立六个烟雾病缺血性/出血性脑卒中危险因素的分析模型,并在内部验证数据集和外部验证数据集中对六个模型进行验证;而后比较这六个模型的性能。最后,采用联合三个模型(XGboost,SVM和LR模型)共同的特征重要性排序与单因素分析结果相结合的方法,综合分析确定烟雾病患者缺血性/出血性脑卒中的危险因素;结果:1、研究对象根据入选标准和排除标准采集南昌大学第二附属医院大数据库中2012年1月1日至2019年12月31日入院的烟雾病患者的相关资料,共994例患者入选(脑梗死组共496例,脑出血组共498例);其中2012年1月1日至2017年12月31日入院的入选患者共790例(脑梗死组共397例,脑出血组共393例),采用单因素分析比较这部分患者的资料,并将这部分患者按7:3的比例随机分割为模型的训练数据集和内部验证数据集(训练数据集n=553,内部验证数据集n=237);2018年1月1日至2018年12月31日入院的入选患者共204例(脑梗死组共99例,脑出血组共105例),这部分患者被作为模型独立的外部验证数据集(n=204)。2、临床特征本研究第2章的结果显示:脑卒中型烟雾病患者中,脑梗死组与脑出血组的患者例数基本相等(397例:393例),男女性别比例为1.02:1,中老年(≥45岁)为高发年龄(551例,69.75%);入选的烟雾病患者“乡镇居住地”比较常见(664例,84.05%),且患者颈内动脉受累(434例,54.94%)较大脑中动脉受累(356例,45.06%)略常见,就血管受累程度而言,受累血管狭窄(625例,79.11%)较闭塞(165例,20.89%)常见;入选的烟雾病患者Suzuki分期主要集中在第2,3,4,5期。3、单因素分析两组患者的“性别”、“发病年龄”、“长期居住地”、“医疗保险类型”、“住院次数”、“高血压病史”、“糖尿病病史”、“入院时空腹血糖”、“高密度脂蛋白”、“甘油三酯”、“合并动脉瘤”、“受累血管”、“血管受累程度”以及“Suzuki分期(2,3,4,5期)”均存在显著差异;在这些因素中,“女性”、“中老年(≥45岁)”、“住院次数较多”、“高血压病史”、“空腹血糖增高”、“高密度脂蛋白降低”、“甘油三酯增高”、“受累血管狭窄”和“Suzuki分期第2,3期”可能是烟雾病患者发生缺血性脑卒中的危险因素;然而,“男性”、“青壮年(18岁—44岁)”、“乡镇居住地”、“住院次数较少”、“颈内动脉受累”、“受累血管闭塞”、“合并动脉瘤”以及“Suzuki分期第4,5期”,这些危险因素可能与烟雾病患者发生出血性脑卒中密切相关。4、模型的建立和验证对所采集的数据集分别采用XGboost、SVM、LR、MLP、RF和NB六种机器学习算法建立烟雾病缺血性/出血性脑卒中危险因素的分析模型,并对这六个模型在内部验证数据集和独立的外部验证数据集中进行验证。六个机器学习模型在内部验证数据集中的区分能力均较好(AUC>0.75);外部验证集的结果显示,六个模型在外部验证数据集中的评价指标与它们各自在内部验证数据集中的相应评价指标非常接近。因此,提示这六个模型均不存在数据“过拟合”,模型的结果准确可靠。5、模型的比较在六个机器学习模型中,XGboost,SVM和LR模型的区分能力最佳,尤其XGboost模型表现最为突出,它们在内部验证集中的AUC值依次分别为0.874(95%CI:0.859,0.889)、0.855(95%CI:0.839,0.871)、0.854(95%CI:0.838,0.869)。在内部验证集中,XGboost模型就区分能力和准确性方面可能都优于SVM和LR模型,但在统计学上无显著性差异;相对于SVM和LR模型,XGboost模型在内部验证数据中的准确能力均有所改善,改善率分别为3.1%和3.2%,但在统计学上无显著性差异。6、模型的特征重要性两组患者的“Suzuki分期”、“合并动脉瘤”、“乡镇居住地”、“发病年龄”以及“住院次数”在XGboost,SVM和LR模型的特征重要性排序中都排在前十位,其中“Suzuki分期”、“合并动脉瘤”和“乡镇居住地”在三个模型的特征重要性排序中更是依次排在前三位,提示这些因素对模型的结果有很大的影响。结论:1.脑卒中型烟雾病的临床特征:脑卒中型烟雾病患者脑梗死与脑出血的发病率基本相等,中老年(≥45岁)是高发年龄,女性略多见,乡镇居住地多发,以颈内动脉狭窄多见,Suzuki分期主要集中在第2,3,4,5期。2.单因素分析结果显示:“女性”、“中老年(≥45岁)”、“住院次数较多”、“高血压病史”、“空腹血糖增高”、“高密度脂蛋白降低”、“甘油三酯增高”、“受累血管狭窄”和“Suzuki分期第2,3期”这些危险因素可能与烟雾病患者发生缺血性脑卒中密切相关;3.单因素分析结果显示:“男性”、“青壮年(18岁—44岁)”、“乡镇居住地”、“住院次数较少”、“颈内动脉受累”、“受累血管闭塞”、“合并动脉瘤”以及“Suzuki分期第4,5期”这些危险因素可能与烟雾病患者发生出血性脑卒中密切相关。4.XGboost、SVM和LR等机器学习模型在分析烟雾病缺血性/出血性脑卒中危险因素方面的结果准确、可靠;其中XGboost模型表现最优秀,SVM和LR模型次之。5.多模型联合的结果显示:“Suzuki分期”、“合并动脉瘤”、“乡镇居住地”、“发病年龄”和“住院次数”可能是烟雾病患者发生出血性脑卒中的重要危险因素。
其他文献
目的:研究品管圈活动用于提高护士心电监护仪设置正确率中的作用。方法:选取本院2019年2月~2020年2月56例护士作为本次研究对象,分析品管圈活动前后的心电监护仪设置正确率。结果:品管圈活动实施后,其理论考核评分以及操作考核评分(87.61±3.25)分、(93.23±3.34)分均优于活动前(77.54±3.27)分、(85.03±3.32)分,组间差异具有统计学意义(P<0.05);品管圈活
在强大的5G业务、大数据、云服务等高新技术硬需求推动下,WLAN无线局域网(Wireless Local Area Network,WLAN)成为2022年网络领域的焦点。在万物互联时代,针对目前WLAN网络安全中存在的不足及工作实践中遇见的问题,用模拟器Fiddler抓包测试了如何防御抓包、网络攻防等操作,总结了相对应的几种防范措施,并对各措施的优缺点进行了简要分析,针对性地解决了管理层、转发层
研究目的:探究神经根沉降征(Nerve Root Sedimentation Sign,NRS)阳性患者典型的临床特征,观察清阳理论指导下中医辩证治疗NRS阳性患者伴随症状的临床疗效研究方法:本研究为回顾性研究,共分为两部分。第一部分:收集门诊就诊患者中腰椎MRI影像中存在NRS阳性的病例,筛选出符合条件的病例。用Excel 2019软件将每个病例的一般资料和影像学资料对应汇总,对数据进行初步清洗
背景:颅内动脉瘤破裂与动脉瘤内血流动力学的变化有关,动脉瘤的形态可给动脉瘤内血流动力学带来巨大影响。前交通动脉(Anterior communicating artery,ACoA)是Wills环的重要组成部分,是连接两侧大脑前动脉的重要通道,此处血供复杂,为动脉瘤的好发部位。因ACoA所处部位的复杂性,导致该处动脉瘤形态学因素变化较多。前交通动脉瘤(Anterior communicating
伴随着无线网络的迅速发展,其安全性问题也成为大家关注的重点。由于无线网络是通过无线介质进行传输,信息容易遭到窃取和破坏,因此仅靠物理控制是不能保证网络安全的。虽然无线网络大都采用了ESSID、密码访问控制和无线加密协议等技术来控制无线网络的安全,但仍然存在着不少安全隐患。无线网络设备的存储容量有限,处理速度慢,带宽低的特点决定了它不能像有线网络那样靠高强度的密钥及算法来保证安全性。本文针对无线网络
背景和目的:颅内动脉瘤的血管内介入治疗因创伤小、术后恢复快,已逐步成为颅内动脉瘤的主要治疗方式,但介入术后动脉瘤的残留和复发是困扰神经介入医生的一大难题,所以患者术后需要长期规律的影像随访。磁共振血管成像(Magnetic Resonance Angiography,MRA)作为一种无创、无辐射血管成像技术,已得到临床医师认可并广泛应用。静音MRA是一种新近研发并日趋临床化的非对比增强血管成像技术
小麦孕穗期对低温非常敏感,低温胁迫后外源喷施6-苄氨基腺嘌呤(6-BA),能够缓解低温胁迫对小麦造成的伤害,通过转录组测序技术分析6-BA提高小麦抗寒性的分子机制。选用低温敏感型品种皖麦52和低温迟钝型品种烟农19为试验材料,在孕穗期低温胁迫后喷施20 mg L-1的6-BA溶液,以喷施等量蒸馏水处理为对照。观察幼穗形态,并测定幼穗可溶性糖含量和淀粉含量。再通过转录组测序筛选并分析差异表达基因,探
研究背景腹主动脉瘤(Abdominal Aortic Aneurysm,AAA)是腹主动脉管壁退化和管腔病理性扩张引起的血管疾病,65岁以上人群中患病率可达4%,一旦破裂,死亡率高达65-85%,目前已成为严重危及老年人生命的疾病之一。目前对于腹主动脉瘤的主要干预手段:开放手术人工血管置换(OSR)和覆膜支架腔内修复术(EVAR)。研究发现早期手术修复并没有任何优势,没有显著提高患者的生存率,所以
目的:应用TOF-MRA、Silen Z-MRA和HR-VWI等不同的磁共振脑血管成像方法,对颅内动脉瘤栓塞术后患者图像质量评分、测量载瘤动脉支架段狭窄率、评估动脉瘤术后栓塞状态(是否完全栓塞)进行对比分析,探讨其在动脉瘤术后无创性评估的临床应用价值。材料与方法:收集已接受颅内动脉瘤支架和或弹簧圈栓塞术,且于2021年2月至2022年2月期间接受磁共振血管成像和DSA复查的患者39例,其中男8例、
为研究黄土地区压力型锚索锚固机理,根据压力型锚索锚固段受力状态,基于三线型剪切-滑移模型,推导了注浆体与岩土体界面在弹性阶段所对应的剪应力及轴向应力分布的闭合解.根据相关压力型锚索锚固试验数据,采用推导的闭合解计算了不同张拉荷载作用下界面的剪应力分布,并与试验结果进行了对比.结果表明,各级张拉荷载作用下注浆体/岩土体界面剪应力的分布及其最大值与试验结果基本吻合,验证了本文提出解析模型的正确性与可靠