逻辑回归模型中样本量确定的相关问题研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:WSLBCW
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
样本量的确定是实施抽样调查或者医学临床试验等统计实践的基础工作,合理的样本量既能保证调查或者试验结果的可靠性与准确度,同时能控制调查或试验的费用和成本,在确保试验可信性以及资源节约等方面起着尤为重要的作用。Logistic回归模型在临床医学和药物研发等领域应用广泛。本文针对该模型的样本量计算问题,结合多种不同的信息,给出相应的样本量计算理论,并推导对应的公式。在简要介绍经验法的基础上,详细讨论了公式法的适用场景。首先考虑逻辑回归模型中自变量为二元分类型变量时,计算了三种不同逻辑回归模型的样本量:单风险因子模型、一个暴露因子和一个混杂因子的模型、存在交互作用的两风险因子模型。当自变量为连续型变量时,简要介绍了Wald检验、似然比检验、得分检验这三种不同检验方法在样本量计算中的理论,着重给出了单因子模型的Wald检验方法的具体推导过程。我们也讨论了贝叶斯框架下的样本量计算方法,比较频率派方法与贝叶斯方法的优劣性。再者,介绍了阈值检验法,具体有通过构造分类器的逻辑回归法、交叉验证法、距离法等,并通过大量的模拟计算对几种方法进行比较分析。特别地,利用logistic回归模型的特性,考虑基于logit-normal分布的逻辑回归模型的样本量计算问题,根据logit-normal分布的特点,使用Delta法与优化法将其转化为正态分布,并通过模拟数据分析,比较转化前后所计算出的样本量结果。我们得到如下结论:在同样的功效与置信水平之下,转化后的logistic回归模型的样本量结果明显优于未转化的结果。
其他文献
近年来,我国互联网技术发展迅速,随着“互联网+金融”理念的不断推进和国家对民营银行的一系列引导政策出台,互联网银行应运而生。2014年12月,我国首家互联网银行——微众银行宣布开业,开启了我国互联网银行的元年。互联网银行依托于金融科技,纯在线运营,无线下网点,具有服务不受时空限制、营业成本低、获客能力强等特点,定位于长尾市场,对于推进我国普惠金融的建设、丰富我国的金融机构体系具有重要的意义。新网银
非正规就业在我国城市化进程中扮演者重要作用,但城市规划学界却较少关注非正规就业群体的基础空间行为尤其是职住地决策的规律。基础认知的缺失导致了空间干预政策对非正规就业群体产生了严重负效应。本文的整体上是对非正规就业群体职住关系的基本特点及影响职住关系的因素及机制作一项调查报告。据此提出2个主要研究问题:第一、正规和非正规就业群体,以及不同社区的非正规就业群体的职住关系、职住偏好和流动性有哪些差异化特
随着时代的发展,现在的社会充满了大量与人们生活息息相关的数据。例如中考分数、大学综合排名、专业就业率等都是大量数据的表现。人们的生活需要对数据信息进行分析对结果做相应的决策。这就需要学生具备一定的数据分析能力,掌握一定的数据分析方法。PBL教学法是学生基于问题在自主和合作学习过程中,通过与小组成员合作交流解决实际问题的一种教学方法,其理念符合新课改要求。新课改提倡在学习过程中,应以学生为主、教师为
儿童是祖国的花朵,是未来的希望,但近年来层出不穷的虐童事件却给儿童的健康发展蒙上了一层阴影。已经有研究证明,辱骂、殴打以及性虐待等儿童创伤经历会严重影响到一个人的身心健康,不仅仅当时对儿童造成伤害,还在更长久的影响一个人的一生,有过儿童期创伤经历的人在成年后表现出更多的各种社会适应不良问题和反社会行为。此外,青少年问题行为一直是心理学界和教育界关注的重点领域。打架、逃课、吸烟以及自伤等问题行为会影
改革开放以来,我国农村经济快速发展,农业产量连年增收,农民的生活越来越好。然而与此同时,农村的资源环境状况却越来越不容乐观。面临这样的困境,很多国家开始实行农业生态补偿政策。农业生态补偿政策是目前改善农村生态环境质量、协调环境保护与生产发展之间矛盾的重要手段。展开农户生态补偿受偿意愿影响因素的研究,可以为农业生态补偿政策的制定和推行提供依据。本文随机选取成都市温江区101名农户为调研对象,将农户的
在企业的经营管理中,汇率风险已经成为其面对的主要风险之一。“811汇改”拉开了新一轮人民币汇率形成机制改革的帷幕,人民币兑美元汇率从持续升值转为阶段性贬值。人民币汇率波动对中国企业究竟有何影响?企业汇率风险对冲策略有哪些?其效果如何?这些问题对于深入理解人民币汇率波动的影响机制,分析汇率波动对我国进出口和经济发展的影响,完善我国跨国公司的汇率风险管理具有重要意义。在此背景下,本文考察了海尔智家的人
随着大数据时代的到来,通过数据挖掘获取信息已经成为常态,然而我们获取的数据大多数情况下都是含有缺失值的,也就是说数据是不完整的。然而很多统计方法在做数据分析时,都需要完整数据才能研究。数据缺失普遍发生在各个研究领域中,对缺失数据的处理已经不能局限于忽略或者直接删除,数据插补法逐渐活跃起来。本文主要探讨的是多种插补方法对于分类型缺失变量和连续型缺失变量的插补效果。在探究分类缺失变量的插补方法时,首先
AR教学资源呈现的知识立体化、多样化,其交互性也让学习者可以从中理解、探索知识,被越来越多的教师应用于日常教学中。初中地理知识涵盖面广,抽象的知识是学生理解的难点。本研究结合AR教学资源与初中地理教材内容进行教学设计,并在教学中实践,探究AR教学资源和初中地理教学的整合方式与效果。本论文通过文献研究法梳理了AR资源在教育中的研究现状。以建构主义学习理论等为指导,对课程目标、课程内容和学习者的特征进
数学解题在高中生数学学习中发挥着重要作用,通过对学生数学解题的深入观察了解,发现高中生在数学解题中有如下问题:解题时没有计划、没有方向、解题思路单一、容易犯相同的错误等。而这些都和学生的元认知相关,发展学生的数学学科自我监控能力是数学教学的一个核心问题。因此,本研究将自我监控能力与数学解题相结合,以调查问卷为基础分析高中生数学解题自我监控能力的现状、影响因素以及优化建议。首先,对国内外有关元认知、
随着我国经济的快速发展,生态环境问题也日益突出,尤其是在农业领域。由于农业领域的长时间粗放管理,环保意识不足等原因,农业领域之中产生了诸多生态环境问题,逐渐成为我国农业进一步发展的瓶颈。在农业生态环境治理方面,我国政府也在不断加大政策力度,尝试新的政策工具与方法。中共十六届五中全会,我国政府首次提出“按照谁开发谁保护、谁受益谁补偿的原则,加快建立生态补偿机制”,自此我国生态补偿政策作为强有力的生态