“碎片化数据”的logistic回归模型平均方法

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:leolee19820604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今众多学者致力于利用统计学和机器学习方法从互联网的海量数据中挖掘有效信息。“碎片化数据”在许多领域变得越来越常见:数据的来源渠道是多样的,但每个渠道的数据都有可能存在缺失,将多个渠道的数据组合在一起时,数据矩阵呈现出“碎片化”的特征。关于“碎片化数据”的问题,在因变量为连续变量时,此前已经有学者提出用一种基于线性模型的模型平均方法去处理。本文将该方法拓展到二元因变量的情况,建立起logistic回归框架下的“碎片化数据”模型平均方法。具体来说,我们利用了所有可用的数据,对不同的响应模式构造不同的样本集,建立多个logistic回归模型作为候选模型。每个候选模型都有各自的估计值。进一步,我们利用CC样本(没有发生缺失的样本)来选择权重,模型平均的最终输出值是所有候选模型的加权平均,我们证明了所选权重的渐近最优性,并通过数值模拟和实例分析验证了该方法的有效性。
其他文献
自读后续写提出以来,其促学功效已逐步得到证实,促学原理在于续写中的互动协同效应,即学习者注意和模仿目标形式的过程。因此,注意是语言协同的重要因素。但在读后续写中,学习者对英语关系从句的注意差异是否会导致学习效果的差异,仍需进一步证明。因此,本研究借助读后续写任务,使用任务指令和篇章强化两种任务条件来强化学习者对英语关系从句的注意,进而探讨任务条件对英语关系从句促学效果的影响。本研究以广州某高中二年
新疆地处中国西北干旱区,气候干旱,水资源匮乏。近年来,随着社会经济的发展,新疆人水关系日益紧张,且用水结构、自然地理环境状况等与我国其他地区存在着巨大差异。因此,定量评价该地区人水和谐度,揭示其时空演化规律,模拟未来演变趋势,对于完善我国的人水关系研究具有重要的理论与现实意义。本文利用2006–2016年新疆社会经济和水资源数据,建立人水和谐定量评价指标体系,采用熵权法和层次分析法确定权重,利用模
精准把握学生的知识状态是开展有效教学和实现高效学习的前提。认知诊断模型能将学生潜在的知识结构(即属性)外显为可观察的属性掌握模式和掌握概率,获得翔实且较为准确的反馈信息,实现对学生的精确诊断。利用认知诊断理论测量学生认知结构的研究已较为丰富,但当前化学键教与学的相关研究多关注教材、迷思概念和教学策略,基于认知诊断理论进行化学键学习的测评研究还极少。研究主要利用文献法和测试卷调查法,在梳理属性及层级
随着统编教材的推广和新课程改革的深入,名著阅读已经成为初中生语文阅读的重要内容。名著蕴含的综合性,有利于提升学生阅读实践能力;名著蕴含的经典性,有利于学生高尚的审美情趣、健全人格的形成;名著蕴含的人文性,有利于提升学生的语文素养。本研究主要采用文献法、调查法与案例研究法,从名著阅读教学指导中的问题切入,采取“大胆实践--理性反思”的研究路径,探究了“分层--迁移”的教学框架,形成了一套切实可行的教
加德纳的多元智能理论打破了传统以语言能力和逻辑-数理能力为核心的智力理论,他认为人的智能还包括音乐、身体-运动、视觉-空间等八个方面的智能,这无疑为高中古诗词教学研究开拓了新的思路。首先在高中古诗词教学的教学理念上更加关注学生的主体性、差异性和发展性。其次在教学手段上能够提供更加丰富多样的教学方式。最后在教学过程中,教师往往能发现学生的差异性,因材施教,发展学生的语文核心素养。因此,论文主要从四个
阅读教学一直是英语教学的重要组成部分。然而,当前的高中英语阅读教学存在着一些问题:教学模式单一、课堂师生互动较少等,这导致了学生阅读兴趣低下,影响了学生阅读水平的提高。多模态教学指在教学中运用语言符号和多种非语言符号来调动学生三种或三种以上的感官参与学习的教学方式。多模态教学能够激发学生的学习兴趣,进而改进教学效果。近年来,国内外专家对多模态教学运用于英语阅读教学进行了大量研究,但关于多模态教学对
应用文写作是高职语文课的重要一部分,会写应用文是聋生走向社会的必备技能,既提高聋生的语言能力与思维能力,也帮助聋生与人沟通交流,赢得好的职业发展。但现实中,普遍存在高职聋生不爱应用文写作,在写作中不擅长构思、表达与修改,应用文写作能力弱、思维能力差等问题,且应用文写作在高职聋生教学中也存在课堂吸引力不足,教学内容与生活联系不紧密,教师对聋生自主学习引导不足,生生协作程度不够,评价与修改主体和方式单
健康作为人力资本的重要组成部分,一直以来都是经济学家研究的重点问题,在劳动经济学领域,个体健康的增加不仅能提高劳动生产率,而且可以促进个人效用的提升。在当前中国社会老龄化趋势加快的背景下,社会养老负担加重,如何保障老年人的健康与养老成为全社会关注的焦点。中国人历来就有“养儿防老、积谷防饥”的思想观念,子女承担了赡养父母的主要义务,父母的晚年健康很大程度上与子女的个人能力和社会资源相关联。教育是子女
王初明(2011)曾指出,外语学习效率的高低取决于语言理解和输出活动结合的紧密程度。因此,一种以“阅读+写作”的阅读型输出活动的词汇学习方法被提出,被研究的阅读型输出活动通常为概要写作和读后续写等。但哪种阅读型输出活动对词汇学习更有效仍存在争议。另外,关于探索二语学习水平如何影响受试词汇学习表现的研究鲜有报道。因此,为了比较不同形式的读写任务对不同水平学习者的二语词汇习得效果,本研究提出以下两个问
汉语截省句是指由先行小句和截省小句组成的句子,先行小句包含先行成分和关联成分,截省小句包含疑问词/短语部分和空位成分。最早提出截省句相关理论的是Ross(1969),Ross认为截省句(Sluicing)是由一个疑问词和一个空位成分构成的小句。随着截省句研究的发展,截省句的定义被拓展,分为广义和狭义。狭义的截省句是只含有一个疑问词/短语的小句,是一种语音形式不完备的省略句式;广义的截省句一般有两个