含有缺失和删失数据的转移模型分位数变量选择

来源 :浙江财经大学 | 被引量 : 0次 | 上传用户:lsssyd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生存分析中,比例风险模型在医学领域有广泛的运用,因其具有多种优良的性质,常用来对生存时间进行估计并评估各个影响因子的作用,是生存分析中的较常用的方法,然而该模型存在一定的局限性。与此同时,医学数据分析过程中经常会遇到数据缺失和删失的情况,然而由于医学数据收集困难、样本量少等因素,使得数据尤为珍贵,如何有效利用缺失和删失的数据对医学生存分析有重要意义,且医学数据相关协变量较多,具有一定的稀疏性,删去无效变量保留显著效应的变量对医学生存数据分析显得尤为重要,同时生存函数具有单调的特性,一般估计方法无法满足相应要求。针对上述问题,本文将常用生存函数模型进行了推广,放宽了相应的条件,得到了更为泛化的转移模型。该模型为多种生存模型的扩展,在临床数据分析中具有更高的灵活性。基于推广后的转移模型,本文首先采用了拥有良好稳健性的分位回归方法,从多个角度对数据进行分析,进一步采用自适应Lasso进行变量选择,最后对回归的生存函数进行单调化处理,并且在理论上证明了模型估计拥有优良的渐近性质。在数值模拟中,本文通过三个步骤进行模型估计:第一步,首先采用缺失值补全方法,对缺失的数据进行补全;第二步,针对补全的数据,采用删失分位数回归方法,在估计过程中,采用两步迭代法进行局部线性展开估计,同时使用自适应Lasso进行惩罚;第三步,对估计的转移模型进行单调化处理。通过仿真试验分析,可发现模型在缺失和删失数据占总样本量偏低的情况下,模型拥有优良的数值拟合和变量选择的能力,且随着样本量的增多其能力也随之提高。而在缺失和删失数据占总样本量偏高的情况下,模型也有较不错的性能。这表明本文所改进的估计模型具有良好的拟合能力以及鲁棒性。在实例分析部分,将推广后的转移模型运用到山西肿瘤医院鼻咽癌患者的生存分析中,通过对患者生存数据设定多个分位点进行分位数回归变量选择,可以发现模型能有效的去除不相关的影响因子,并且可分析得出同影响因子对不同程度患者生存时间的影响效应。综上所述,本文改进的基于缺失和删失响应变量的转移模型分位数回归估计及变量选择方法,能很好地满足现实中医学生存分析中响应变量缺失和删失以及数据稀疏等多种需求,有效进行统计分析。
其他文献
阐述了高等教育国际化与教育创新的关系 ,高等教育国际化离不开教育的创新 ,是教育创新的结果。提出了通过构建教育创新体系加快我国高等教育国际化进程的新思路
怀特海的过程教育哲学思想基于其过程哲学观。从过程教育哲学的视角审视中国现代教育,我们力图回答以下问题:如何保持促进社会发展与人的发展的和谐统一?如何保持普通教育与
<正> 我们节约耐烧煤炉和易燃点火煤饼的研制工作,是在国家计委、中国科学院、商业部的重视和热情关怀下进行的。一年多来,在毛主席革命路线指引下,特别是在以华主席为首的党
期刊
“科技改变媒介,媒介更新人文”,是人类时代发展的主旋律。数字展馆作为数字时代信息传播的一种载体,是展示设计领域的一种新形式。它以尽可能直观真实生动的形式,对与展馆主
作为一个早期的马克思主义者,李大钊在传播中国马克思主义思想中扮演了一个很重要的角色。李大钊在十月革命前的,所积累的科学的、战斗的革命思想,以及对社会主义思想的初步
城市形象外宣英译在全球化背景下跨文化交际目的性强。本文以益阳市为例,以目的论为指导,阐述了城市形象外宣翻译的重要意义及其应突出信息、审美、呼吁三大功能,灵活采用目
地铁商圈其实是一个非常宽泛的概念,包括占主要份额的地铁广告以及报刊音像连锁店、冲印连锁店和便利店等等各种综合性商业。
<正>随着我国创建世界一流大学目标的确立,研究生教育日益成为我国大学发展所关注的焦点。与此同时,在2005年1月召开的全国研究生培养定位及硕士生学制研讨会上,与会代表提出
<正>编辑部:这段时间我晚上睡觉梦多,第二天醒来感到头昏脑胀,觉得没休息好。请问,这是什么原因造成的?睡觉做梦是否有损健康?读者范勇宏范勇宏读者:经常听到有人说:"我怎么
研究确定英语动结构式的区别性特征,对其历史源流和发展脉络进行梳理,发现力的施受关系是贯穿其发展的核心语义特征。典型SVOC/A.结构表达S以V施力O并致其发生状态变化C,C由