贝叶斯分层模型在二分类因变量数据中的应用

来源 :云南大学 | 被引量 : 0次 | 上传用户:wolfcner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯方法的基本原理是利用观测数据提供的关于参数的似然信息,结合参数的先验信息,最终得到参数的后验信息。分层模型是指不同分组下的观测值取决于每组对应的参数,而每组的参数又会由其超参数决定,由此呈现出一种分层结构。贝叶斯方法天然的适用于这类分层结构,并且随着贝叶斯统计的不断发展以及各类统计软件和相关程序包的开发完善,贝叶斯方法成为研究分层模型的一种重要方式。本文旨在应用贝叶斯分层模型研究因变量为二分类变量的情形。首先,系统讨论贝叶斯分层模型的构建与估计方法。本文在介绍传统的logistic回归模型和参数为线性形式的分层logistic回归模型的基础上,针对分组数据,构建因变量为二分类变量的贝叶斯分层模型。由模型中参数的似然函数和先验分布求得联合后验分布,进而得到各参数的条件后验分布,之后采用Gibbs抽样和MH抽样对各个参数进行估计。其次,对构建的贝叶斯分层模型进行了模拟测试和实例分析。在模拟测试中,生成样本量为1500的模拟数据,比较了建立传统logistic回归模型和建立贝叶斯分层模型后参数估计效果上的不同,并对建立贝叶斯分层模型的预测效果进行性能度量,结果表明,模拟数据的分类预测效果比较令人满意;在实例分析中,以德州扑克的策略分析为研究对象,根据选取的德州扑克数据集将玩家分为三种类型:紧张型、中间型和放松型,将玩家在每一局牌局中的“输”和“赢”视为二分类因变量,通过Boruta方法筛选出影响德州扑克玩家输赢的7个影响因素,由欠抽样方法选取样本作为训练集,建立贝叶斯分层模型并分析三种不同类型的玩家在德州扑克牌局中的游戏风格和策略,随后将全部样本数据作为测试集,通过性能度量指标验证了模型的预测效果较为理想。最后,本文针对文中构建的贝叶斯分层模型可能出现极端离群值的情形对模型进行了改进,改进模型的分析结果表明,通过在原有模型中加入随机因子项可以使模型更适应实际数据的应用。
其他文献
当今社会,伴随人口年龄结构、医养资源、养老康疗需求等方面的不断变化,大量社会资本不断涌入康养产业,康养产业的目标客户群体也越来多样化,市场竞争格局也在不断演变。同时,近年来房地产企业库存积压,传统地产企业销售增速不断下滑,传统地产企业纷纷探索转型,找寻新的经济增长点。昆明市作为云南省省会城市和龙头城市,在当前全市经济规模和结构问题突出、主导产业增长乏力的情况下,结合自身的基础和优势,昆明市政府作出
在中国古代漆器发展史上,素髹漆器是具有独特地位的一种漆器类型,它于新石器时代开始出现,两宋时期发展到巅峰。两宋时期的素髹漆器在特定的历史条件下兴起并对后世漆器产生重要的影响。文章首先论述了中国古代漆器史上素髹漆器的发展概貌,通过整理每个时代出土的素髹漆器,总结出无论是审美上崇尚富丽之风的时代,抑或是在审美清雅的时期,素髹漆器都有一定的地位,而中国古代素髹漆器的发展历程便是两宋素髹漆器之“缘”。文章
金砖国家是世界经济发展的新引擎,代表着世界经济发展的主要方向。其经济增速快、发展潜力大的特点让世界为之瞩目,但近年来金砖部分成员经济出现了较大波动。产业结构变动是宏观经济波动的重要来源之一,产业结构的优化调整能够促进宏观经济的良性化发展,进而缓解经济波动。本文将基于产业结构差异视角对金砖国家显著的经济波动现象进行解释,并指出基于产业结构差异视角缓解其经济波动的途径。本文根据产业结构影响经济波动的研
人才是软件服务企业发展的根本和命脉,也是核心竞争力。当前各软件服务企业对人才的需求已经不单单局限于某项专业知识,相关技术人员还需要横向发展自己的知识技能。有效的人才培养不仅是企业业务增长和规模扩大的助推器,更是增强行业竞争力的基本途径。在经济全球化趋势下,互联网经济竞争日趋激烈,市场业务的快速增长、公司规模的不断扩大都对人才的素质和层次提出了更高要求。作为知识高度密集的软件服务企业,如何更好地培养
在新媒体已然成为社会基础建设的大背景下,人们的日常行为方式发生改变,构筑起新的文化体系和社会场景。因此,从新媒体与用户的互动角度观察社会、思考社会,进而洞察日常生活中的个体存在、群体交往以及社会运转,具有重要的社会文化意义。全民K歌作为一款音乐社交软件,借助QQ和微信的用户基础迅速占领“K歌”市场,并拥有趣味互动和调音、智能打分、好友打擂、自动修音等多种功能。用户通过“K歌”进行社交,形成了音乐社
十九大报告指出:目前我国正处于全面建成小康社会的决胜阶段。然而当前城市和农村之间发展不平衡问题依旧突出,农村地区发展效率低,农村居民提高收入的后劲不足,而促进收入增长的关键在于提高人力资本水平。近几十年来,学者们关于健康人力资本的研究相对教育来说还是较为滞后。需要得到重视的是,健康与人们日常的生产生活息息相关,良好的健康水平既是经济发展的基础,也是人类发展的首要目标之一,与此同时,农村人口健康相对
本文以“作为艺术批评家的熊秉明”为题展开研究,一方面是为了避免与其他相关研究发生概念上的混淆。另一方面是因为他在艺术批评方面虽然有着相当的成就,但是目前学界对熊秉明的研究重点主要集中在熊秉明的雕塑艺术及书法理论研究。因此,这就为本文研究的展开,留下的足够的空间。熊秉明的艺术批评思想要从雕塑、书法、绘画、诗歌、展览等批评中提炼,并且不包括音乐、设计、戏剧戏曲、舞蹈、建筑和园林等批评。此外,熊秉明的艺
在医学、生命科学、保险等领域研究中,纵向数据和生存数据常常同时被收集,且二者通常是相互关联的,若仅单独分析其中之一,则有可能得到不可靠的结论。因此,为了探索这两类数据之间的相互关系并得到有效的统计推断,许多学者建立能够同时处理纵向数据与生存数据的模型,即所谓的联合模型。目前,在纵向响应的正态性假设下,联合模型得到了广泛研究。然而,一些产生于实际问题中的数据并不满足正态性假定,此时,若依然在正态性假
人身保险作为风险管理、养老保障、资产配置的一种金融工具,本身具有合同关系人复杂、产品形态多样、交费和资金领取灵活等特点,因而为洗钱犯罪分子掩饰、隐瞒和转移犯罪所得提供了便利条件。客户身份识别作为洗钱风险的首道防线,不仅仅是保险公司按照反洗钱法律法规履行法定义务的需要,更是为了确保保险公司在内控机制健全的前提下实现业务的稳健、永续发展,避免沦为洗钱犯罪分子实施违法犯罪活动的工具。基于对客户身份识别重
目前我国经济已经进入了新的发展时代,从高速增长转向高质发展,步入中等收入国家行列,企业在国际社会中的核心竞争力逐渐增强,拥有更多话语权。但是我国企业当前还存在很多问题,资本结构不合理、债务风险较高、资产负债率和杠杆率高居不下等。为进一步加强风险防范,国家适时推出“去杠杆”的政策要求,并出台了一系列相关文件和指导意见,明确对企业尤其是国有企业降杠杆提出了具体要求。随着政策的出台和调整、资本市场疲软和