缺失值填补效果:机器学习与统计学习的比较

来源 :统计与决策 | 被引量 : 0次 | 上传用户:shaoyuqi521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据缺失是众多影响数据质量的因素中最常见的一种。如果处理不好缺失数据,就会直接影响分析结果的可靠性,进而达不到分析的目的。文章以医疗领域的缺失值问题为例,通过灵敏度、准确率和Kappa值三个指标来比较分析机器填补法和统计填补法在不同缺失率下的填补效果。研究结果表明,在注重小比例人群的医疗领域,机器学习方法表现突出,该方法在三个方面皆优于统计填补法。另外,随着缺失率的增长,两种填补方法的效果都有所下降,但值得注意的是,即使缺失率很高时,机器学习方法的填补效果仍然优于统计方法,且具有很高的稳定性。
其他文献
由于全球性的环境恶化与经济危机使得建筑学人开始反思现代建筑活动中不当的行为方式,从而引发了对低碳经济下绿色建筑的深入研究。生土建筑是人类最早并依然沿用至今的建筑类
为了验证第三代海浪模式WAVEWATCHⅢV5.16中不同海冰损耗源项在秋季波弗特海对海冰存在下海浪的模拟能力,建立自波弗特海至马更些河河口的两级嵌套海浪模型,对2014年8月1日至
<正> 信息的重要性,早在我国古代人们用烽火台来传递信号时就已经知道了。但作为一门科学来研究,至少可以从1764年英国沃森在两英里电线上传递了电信号和1876年贝尔发明电话
由于次分式O-U过程在物理、金融等领域有着广泛的应用,所以估计模型中的参数是至关重要的。文章用极小对比法估计次分式O-U过程中的漂移参数,讨论估计量的强一致性,用Monte C
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
波浪波动时间过程及波列的模拟,对于开展实际波浪对于工程建筑物的作用具有重要的意义。本文采用线性叠加的单叠加模型,建立了多向不规则波浪的确定性模拟方法。基于理论模拟
提高政府支持成本估算的准确率,可为各国对未来新能源需求、供应、贸易以及投资决策提供更加准确的数据支持。《世界能源展望2010》对2007—2009年的可再生能源发电和生物燃料
珊瑚礁是全球生物多样性最高的海洋生态系统之一,底栖贝类是该生态系统的重要组成类群。为了解北部湾涠洲岛珊瑚礁底栖贝类的群落现状及特征,于2015年秋季(10月)与2018年春季
地标类建筑的建造作为明确地方特色、打造地方形象的有力手段成为大家关注的对象。地标类建筑应该是群体意志的反应。为避免地标建筑成为公众抨击的疮疾,文章结合网络协同技