面板计数数据的样条估计

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cenghao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文建立了同时包含时变系数和非时变系数的面板计数数据模型。本文构建了四种回归样条估计量,以对比伪似然函数和全似然函数,以对比对模型中的非负函数本身及其对数形式分别用样条估计的差别。本文首次提出了似然函数框架下的惩罚样条估计方法,并将其跟上述最好的回归样条估计方法进行对比。对于惩罚样条估计方法,本文提出了一种基于交叉验证的得分值用于选择光滑参数,并推导出了其易于计算的公式,该得分值不仅能同时选择多个光滑参数,还能选择样条的节点数。本文还对比了四种算法,其中算法1为Projected Newton-Raphson算法,我们验证了在这四种算法中只有它具有全局收敛性。本文通过大量的数值模拟发现:对非负函数本身还是其对数形式用样条估计是否有区别因模型不同而异,取决于它们对应似然函数的复杂程度是否有别;全似然样条估计量往往比伪似然样条估计量有更小的偏差绝对值和均方误差,但需要更长的计算时间;综合估计准确性和计算时间,本文推荐使用伪似然函数下对非负函数的对数形式用样条估计的方法;惩罚样条估计方法比回归样条估计方法的均方误差小约25%,且有时也会有更小的偏差绝对值;惩罚样条估计量的bootstrap方差估计接近于蒙特卡洛方差;当模型误设存在时惩罚样条估计方法仍旧有较高的估计准确性;将惩罚样条估计方法应用到小儿哮喘数据后,发现了IL5对哮喘的时变效应。本文的主要创新点在于:首次研究了带有时变系数的面板计数数据模型的全似然样条估计,首次提出了对模型中的非负函数本身(而非其对数形式)直接用回归B样条进行估计的思路,首次研究了似然函数框架下面板计数数据的惩罚样条估计并揭示了其优于回归样条估计。
其他文献
近年来,由于经济和互联网的高速发展,出现了“数据爆炸”现象,造成了信息过载,由此引出了推荐系统。本文主要针对推荐系统中基于用户的协同过滤(user-CF)算法进行改进。首先,学习了一些较成熟的推荐算法,对各个算法的研究思路及优缺点分别进行概述。其次,针对user-CF算法中用户冷启动的问题,建立基于用户画像的相似度计算模型。最后,针对用户-评分矩阵高维稀疏的问题,建立基于内容的推荐与user-CF
随着时代的进步,大量的自然语言文本出现在了电子商务、论坛、博客等网站上。它们数据量太大,所以无法用人力来一一分析,使用电脑来对这些数据进行语义分析是必然的选择。现在主要的自然语言处理方法有两种,一种是基于统计的方法,它是机器学习领域的成果,主要原理是用词组出现的概率来计算舆情信息;另一种是基于有限状态机的方法,主要原理是由语言专家归纳语法规则,系统读取这些规则并处理文本、生成舆情信息。第二种方法在
基于量热法和MEMS技术所制备的芯片量热计是用于描述化学反应或生物过程的有效工具,具有尺寸小、制造成本低、样品用量小、便携性高等多种优点。它在酶催化反应、活性蛋白肽变性过程、碱基DNA链中核苷酸渗入等生物检测领域有广泛的应用前景。首先介绍了量热计的工作原理和传统量热计的缺陷,并引出了MEMS技术对于芯片量热计发展的推动作用;然后基于器件性能和设计要素包括量热法、传感方式、腔室结构和材料对国内外研究
正态分布凭借其优良的性质被广泛应用到多种统计理论和方法中,因此检验数据的正态性是非常有必要的。近年来,越来越多的实际问题涉及到高维数据,这也让正态性假设检验问题一直充满活力。本文从单变量正态性检验着手,总结了四大类检验方法的基本原理、优缺点和适用的数据类型等。本文将高维数据的正态性检验方法划分为基于统计图的检验、多个单变量的检验、合适的降维方法以及直接对高维数据进行检验。本文还归纳了单变量的正态性
民用飞机制造行业是典型的高技术、高附加值和高风险的产业,需要采用全球协作的方式完成飞机设计制造,是一项复杂程度极高的系统工程,在工业全球化的时代,民用飞机制造企业均采用全球协同研制的模式,来开展民用飞机的研制项目。我国民用飞机研制企业也采用“主制造商—供应商”的研制模式。在这一模式下,如何建立行之有效的供应商管理和评价体系,提升供应商协同研制效率,成为关键问题。本文通过分析民用飞机供应商管理中存在
随着国内经济的快速发展及金融市场的日益成熟,信用卡作为一种方便快捷的支付方式越来越受到消费者的青睐,成为商业银行主推的金融产品。为应对激烈的市场竞争及业务量的持续增长,商业银行需要不断完善业务系统,并持续探索提升客户体验的新策略。某商业银行在信用卡核心发卡系统升级的基础上,同步将一卡一账户的卡账体系变更为以客户为主体的多卡一账户的结构形式,账户对应每个客户建立并统筹管理下属卡片。客户卡账体系的变更
电子商务平台的发展目前已经达到普遍的瓶颈,即线上流量已触达天花板,若想有所突破,必须利用线下的流量,通过提升消费者的购物频次来实现流量提升。而传统零售业的份额也逐步被电商行业所挤压,倒逼传统零售业改革。同时消费者对商品质量与服务体验有了进一步的要求。因此,各大互联网企业、传统零售业纷纷开展线上线下融合业务,利用“新零售”形态提升用户体验,但均未能有效达到预期目标,主要暴露出两个问题:(1)传统线下
高性能、高分辨率、低成本的非制冷焦平面红外探测器是第三代红外探测技术的发展方向。大量理论研究表明,InAs/GaSb Ⅱ类超晶格材料具有较大的量子效率和响应率,较小的隧穿电流和俄歇复合,能带连续可调,调整超晶格的周期厚度,截止波长覆盖3~30μm探测范围,被认为是第三代红外探测器的优选材料。本课题主要以InAs/GaSb Ⅱ类超晶格模拟计算和材料研究为目标,对能带计算,材料制备,材料表征进行了研究
《k-10汉语课程大纲》是澳大利亚新南威尔士州针对汉语教学颁布的地域型汉语课程大纲,该大纲根据学生背景及年龄的不同,设定了相应的教学目标和教学内容,对当地K-10阶段的汉语教学起指导性作用。本文以澳大利亚新南威尔士州的汉语教学情况为背景,运用对比分析法、问卷调查法、访谈法,对该大纲展开相关研究。首先,本文主要研究了《k-10汉语课程大纲》的制定及修订标准,主要内容和特点。本文概括出该大纲的六大特点
材料破坏通常涉及弹塑性变形和断裂过程。对于塑性变形,连续介质力学可以通过屈服函数和流动法则有效地来处理。由于连续介质力学是基于场连续假设基础上的一个理论体系,因而它在处理裂纹方面存在一些局限性。格子模型(Lattice model)能够有效地模拟断裂问题,但是它在模拟塑性变形方面还不充分。为了将塑性变形和断裂耦合在格子模型中,本文在离散虚内键模型(Discretized virtual inter