不同缺失场景下各缺失值不同处理方法的结果比较

来源 :四川大学学报(医学版) | 被引量 : 0次 | 上传用户:flw00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的收集四川省肿瘤医院头颈部肿瘤患者住院病案信息数据,探讨不同缺失场景下数据缺失值通过完成者数据集法、期望-极大化法(EM)、马尔可夫链-蒙特卡洛法(MCMC)3种方法处理后的标准化住院天数对标准化住院费用对数值的回归系数估计值r的优劣。方法运用R 3.4.1软件,采用蒙特卡洛模拟,通过设定缺失比例和缺失机制模拟不同场景的缺失数据集,运用完成者数据集法、期望-极大化法、马尔可夫链-蒙特卡洛法估计不同缺失场景的模拟数据集中标准化住院天数对标准化住院费用对数值的回归系数估计值r,并与完整数据集的回归系数估计值r_c结果进行比较,从准确度(各种方法估计的r与r_c比较)和精确度(各种方法的r的变异程度s)两个角度进行评价。结果 3种缺失值处理方法的优劣在不同的缺失场景中均有所差异,完全随机缺失(MCAR)和随机缺失(MAR)(1∶2)机制下,当缺失比例小于30%时3种方法的估计值r均在可接受范围(r_c±0.5s_c);MAR(比例=2∶1)机制任意缺失比例下3种方法的估计值r均在可接受范围内;任意缺失场景下用EM法估计的r的标准误s最小,且与r_c的标准误sc最为接近。结论在选择缺失值处理方法时,应该考虑数据的缺失比例和缺失机制。
其他文献
时域有限差分(FDTD)方法是1966年K.S.Yee首次提出的,由于其强大的功能,已经成为电磁场数值模拟的重要方法之一,目前广泛的用于微波电路的研究。在用FDTD方法分析微波电路时,
学校里交流读书心得时,不少教师都用激动的心情交流《窗边的小豆豆》,这引起了我的好奇。从网上搜出后,忍不住一口气读完,这还不能罢休,又从同事手里借来,反复品读,进一步品味小豆豆
在初中英语教学中,过程性写作教学活动的有效开展,既可以帮助学生消除对写作的抵触、畏难心理,又有助于学生写作兴趣的激发与培养,帮助学生准确把握写作目的,促进其写作水平
研究的主要目的是构建一套能够科学衡量历史街区土地利用效益的评价指标体系,克服片面追求经济利益的开发方案,实现城市土地利用综合效益最大化的更新目标,以有效保护历史街区,传
中秋将至,合家聚餐之时却往往是吃出祸端之际。怎样的饮食原则才是健康之道,你又如何根据自己的体质来选对食谱,细听中医专家解说一二。脾胃虚弱的人群不适宜吃月饼,否则月饼
GaSb基双极级联新结构量子阱激光器可以有效提高器件输出功率,改善器件特性,近年来受到广泛的关注。本文针对高质量的aSb基锑化物材料生长和特性表征作了较细致的研究工作,在
激光诱导击穿光谱法是利用强激光束通过聚焦透镜聚焦到样品的表面,产生激光等离子体,对等离子体中的原子和离子的发射光谱进行元素分析的技术.在本论文中,我们首次尝试把此项
梁晓声也写儿童文学了。在第29届书博会上,山东教育出版社集中推出了5本梁晓声童话。$$近年来,越来越多的成人文学作家开始创作儿童文学,比如张炜、毕飞宇、虹影、赵丽宏、余华,
会议
为提高乳化液浓度在线检测精度,阐述了乳化液浓度在线检测技术的研究现状,对比分析了常用检测方法的技术原理、检测方案、优缺点,总结了该技术的产业化现状,提出了一种基于高
随着我国互联网技术的快速发展,教学模式与教学方法快速变革,个性化学习越来越受到关注。但是,许多学生在学习中无法有效地选择所需要匹配的学习资源,或者在搜索查找的过程中