特殊函数型数据和生存数据的分析与建模

来源 :清华大学 | 被引量 : 0次 | 上传用户:haolong12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代科学技术的迅速发展增强了数据的收集、存储和处理能力,复杂的数据类型在统计学领域越来越常见.这些数据包括函数型数据和生存数据.函数型数据数据可以看成关于时间的函数,每个个体能在若干个时间点被观测记录;生存数据则因为数据的删失,造成所感兴趣事件的发生的时间无法完整记录.本论文分为四部分来研究特殊类型的函数型数据和生存数据.首先,本文研究函数型片段数据中均值和协方差函数的估计.在函数型数据分析通常假设所感兴趣的观测时间区域内有足够的数据用来估计均值和协方差函数.然而,函数型片段数据仅在有限长度的子区间内被观测到.这样的观测造成没有数据能够直接用来估计协方差函数在非对角区域的值.本文提出使用解析基函数表示协方差函数,将对角线区域的信息传递到非对角线区域,从而得到协方差函数的估计.本文证明了该方法可以用于对函数型片段数据中无限秩协方差函数的估计.并且给出协方差函数的估计的大样本性质.其次,本文提出变系数可加模型拟合含稀疏函数型响应变量和函数型(或数值值)协变量的数据.变系数可加模型是一个同时具有灵活性和可解释性的有效降维模型.本文给出了该模型中各未知参数的相合估计和这些估计的收敛速度.对于实际的求解,本文提出一个算法克服了由目标函数的非凸性引起的挑战.进一步地,数值模拟和实际数据分析说明所提出方法具有有限样本性质.再次,本文考虑函数型数据在生存分析中的应用.在大型流行病学队列研究中,病例队列设计是一个与昂贵的协变量收集相关的有效降低成本的研究方法.但已有的病例队列研究,主要考虑协变量是向量值的情况.本论文研究病例队列设计中同时含有函数型和向量值协变量的Cox模型,建立了最大惩罚拟似然函数估计的渐近性质,证明了向量值系数估计的渐近正态性和获得函数系数估计的收敛速度.本文还通过数值模拟和实际数据分析验证方法的有效性.最后,本文将深度学习应用到生存分析.尽管深度学习在传统的有监督学习中表现出色,但仍不清楚它在生存分析中的最佳模型是什么.与大多数方法直接估计生存函数不同,本文提出深度加速失效时间模型对生存时间直接预测.本文另外提出的深度扩展危险率模型是一个十分灵活的模型.所提出的方法在实际数据与其它方法比较,结果显示所提出的方法表现是最佳的.
其他文献
在全球气候变化与快速城市化的背景下,城市系统所面临的不确定因素与未知风险不断增加。极端天气、疫情蔓延等外部扰动事件使交通系统极易产生级联失效或大面积瘫痪,实现韧性交通系统的需求十分迫切。论文以“宜居、韧性、智能”为总体目标,研究主要围绕大范围城市道路网络的系统建模、系统特性与系统控制三个方面开展,解决了多因素耦合建模、系统响应机制与韧性导向的自主协同控制三个问题。首先,针对复杂交通系统多因素耦合作
本文提出了一种采用纤维增强复合材料(Fiber reinforced polymer,FRP,简称复材)、钢材和混凝土的新型组合剪力墙:内置复材约束芯柱的组合剪力墙。复材约束芯柱(FRP confined concrete core)简称为FCCC,包括(FCCCOriginal)、FCCC-R(FCCC-Rebar)和FCCC-PR(FCCC-Prestressed Rebar)三种不同的构造形
中国文化现代化遵循文化现代化过程的一般规律,以实现人的全面发展为价值取向。基于文化发展、国际互动、文化转型的三维框架进行分析,当下中国文化现代化存在文化发展不平衡不充分、国际互动面临严峻挑战以及文化转型带来负面效应等现实问题,一定程度影响了人的全面发展。为此,需深化社会主义核心价值观培育、强化文化发展的治理能力、提升国际互动的文化引力、坚持文化转型的共生取向,系统推进中国文化现代化的人学自觉,不断
带竖向连梁的偏心支撑组合框架(简称“Y型偏心支撑组合框架”)相比于传统的偏心支撑组合框架具有三大优势:连梁的布置形式更为灵活、连梁的安装与拆卸更为便捷、震后结构的可修复性更强。当竖向连梁采用低屈服点钢材时,结构的耗能能力可进一步提升。本文对Y型偏心支撑组合框架的力学性能和设计方法展开研究,通过试验研究、数值模拟和理论分析等手段,从构件层次和结构层次明确了该结构体系的受力机理与耗能机制,并提出了该结
学位
棕地再生是风景园林学科前沿的热点研究问题,也是当代中国资源衰退型城市转型与可持续发展进程中亟待解决的现实问题,具有前瞻性和重要性。中国资源衰退型城市的棕地占据城市优质空间、数量多且多以相对集中的形态出现,其再利用给土地有效利用、生态空间与社会空间提质以及区域协同发展带来了挑战与机遇,需要超越“就地论地”的区域视角。本研究以资源衰退型城市中的典型棕地类型工矿业类棕地为研究对象,在区域的视角下,综合采
作为中国首批试点的十大国家公园之一,祁连山国家公园旨在保护区域生物多样性和自然生态系统的完整性和原真性。祁连山国家公园在我国“一带一路”政策的实施和生态文明建设中发挥重要作用。它不仅保障我国西部生态安全屏障的健康,同时也为生态环境修复与保护积累经验,为国家公园体制建设提供借鉴。近年来,在气候变化和人类活动双重压力下,祁连山国家公园生态环境面临严峻考验,部分区域出现植被退化、水土流失和冰川退缩等生态
SIRT6是一种定位于细胞核NAD+依赖的去乙酰化酶,在DNA修复、端粒维护、葡萄糖与脂质的代谢、炎症反应、癌症的发生与发展以及机体的长寿与健康等方面发挥重要作用。前期研究发现SIRT6参与维持有丝分裂/减数分裂准确性和基因组稳定性,但是,有丝分裂期间SIRT6调控的分子机制仍未完全阐明。在本论文研究工作中,我们发现SIRT6的表达异常导致有丝分裂缺陷和染色体数目改变,进一步的研究表明SIRT6是
癌症作为导致人类死亡的第二大疾病,一直以来都是全球范围内备受瞩目的公共卫生问题。通过积极调动或增强机体自身免疫反应来治疗癌症的免疫疗法被认为是近几年来癌症防治领域最具有前景的方法之一。但是肿瘤细胞采取各种策略迫使免疫治疗失效,其中最受瞩目的免疫逃逸方式就是细胞程序性死亡(Programmed cell death,PD)途径。活化的T、B淋巴细胞表面表达程序性死亡蛋白1(Programmed de
提高射频直线加速器的加速梯度能够大幅减小加速器设备设施的空间尺寸并降低建造成本。射频击穿现象是限制加速器达到更高梯度的重要因素之一。射频击穿现象会对束流品质造成影响,甚至造成束团丢失。同时,射频击穿现象还有可能对加速结构的表面造成永久性损伤。射频击穿现象的统计规律研究表明,射频击穿发生概率与加速梯度的30次方成正比,与入射微波脉冲宽度的5次方成正比。根据经验关系可以推测,加速器在更短的入射微波脉冲