随机森林算法预测医院患者院内感染的应用研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:tbtbtb5518232
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗信息化的不断发展,医学问题受到了更多关注,越来越多的医学领域问题可以通过计算机技术解决。目前医院感染性疾病是导致死亡的全球第二大原因,医院院内感染不仅会带来患者的身体与经济负担,还会造成医院资源的不合理使用。现有针对医院院内感染的监控与检测的方法中,许多采用事后判断法,有一定的滞后性,而一些事前监测手段表现出单一、不全面的特点,医院院内感染风险预测的问题亟待解决。本文提出了基于改进的随机森林模型预测患者发生院内感染的风险,为及时发现院内感染风险和提高院内感染预测准确率做出进一步探究。首先,分析患者院内感染数据的特点,依据这些特点和随机森林算法的输入要求,对原始数据集进行预处理,以获得最全面、高质量的特征集合。其次,针对原始医疗临床数据存在不平衡性的问题,即感染数据远远少于非感染数据,利用SMOTE算法,对非平衡数据做平衡化处理,提高分类模型预测准确率。再次,提出一个改进的扩展随机森林算法,能够对新样本给出是否发生院内感染的精确预测。改进的扩展随机森林算法是对多种感染类型分别生成随机森林,这些随机森林组合成扩展的随机森林,应用Hadoop组件和Mahout机器学习库实现扩展的随机森林算法。最后,分析处理秦皇岛市第一医院的14223596条临床数据集,提取实验数据,对数据平衡化后,实现随机森林算法并进行测试,然后利用评估标准对改进的随机森林预测结果进行评价,评估表明扩展随机森林算法的预测准确率高于传统随机森林算法。
其他文献
目的:探讨双歧杆菌三联活菌肠溶胶囊联合蒙脱石散治疗小儿腹泻的临床效果。方法:以2015年1月~2016年1月在我院接受救治的腹泻患儿125例为研究对象,结合入院时间先后分为两组,
根据城域网的定位及作用,对城域光网络的结构、组网原则和光纤选用等问题进行了讨论。
在全球经济和信息一体化的环境背景之下,我国传统的工业建设,也就是建筑产业,面临着新的挑战。建筑企业利用信息技术提高效率是我国建筑工业需要解决的问题,本文对如何将信息化管
简单介绍了在接入网中采用单层网络结构的优点,并对多层与单层网络结构,在安全性、电路调度性、扩容性及设备使用量等方面进行了比较.
鱼精蛋白是一种多聚阳离子天然肽类,它是一种碱性蛋白质.为探讨其抑菌作用,我们研究了鱼精蛋白对黑曲霉细胞内的琥珀酸脱氢酶和苹果酸脱氢酶的影响.结果表明,鱼精蛋白具有抑
1国际电联积极支持IPv6发展国际电联(ITU)于1865年成立,1947年成为联合国负责全球电信事务的专门机构,现有189个成员国和近700个所谓的"部门成员",即工业界成员.
古生菌最早于上世纪70年代末被发现,它们是生命树的三大主要分支之一,另外两种是细菌及真核生物(包括植物和动物)。但是科学家知道最近才从生态角度了解古生菌的生存机制。
随着新时期建筑业的不断发展,对建筑给排水技术的要求也不断提高,但是在快速发展的过程中,工程项目质量管理也存在着一定问题。为了适应和推动建筑业发展,必须不断改进和提高
据日前来自中消协的消息,世界卫生组织经过3年的研究,评选并公布了六种最健康食品和十大垃圾食品。