医疗保险损失分布拟合方法研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:zhl165408
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国外医疗保险精算起步较早,伴随着数学、统计的不断发展,已经发展到比较成熟的阶段了。保险机构积累了较为全面的数据,并能用相对精细的模型进行产品定价、提取准备金、精算监管、风险控制等。我国医疗保险本世纪八十年代初期才刚起步,经过二十多年的发展,虽然产品种类和质量、业务规模和水平都有了突飞猛进的发展,但我们仍面临着一系列问题,遇到了赔付风险居高不下的瓶颈。面对现在存在的各种问题,我们除了从政策层面上来加以引导解决外,还要利用医疗保险精算对其提供技术支持。医疗保险损失分布是医疗保险精算的基础和核心,也是保险产品定价的基础,是合理提取准备金的前提,是保险监管的重要依据。所以,对医疗保险损失分布具有重要的理论和现实意义。本文主要对医疗保险损失方法及其拟合过程进行了较为系统地研究。本文有三万余字,共分三章完成,主要内容和观点如下:首先是前言,分为三部分。第一部分阐明了研究的背景和意义:近二十年来,我国医疗保险有了较大的发展和进步,取得了喜人成绩,但在此背后,也隐藏着一些问题,与发达国家的差距仍很大,产品开发程度不够,风险控制能力较差,赔付率很高等。要解决这些问题,医疗保险精算技术显露出了它的重要性。医疗保险精算技术以保费的测算为基本前提,而保费测算的前奏和必经之路则是对医疗保险损失分布的测量及其拟合研究。但国内对医疗保险损失分布拟合方面还缺乏系统的研究,所以,本文对医疗保险损失分布进行较系统地研究具有理论和现实意义。第二部分是文献综述,总结归纳了国内外对医疗保险损失分布拟合方面的研究状况。第三部分介绍了本论文的研究内容、思路和方法。第二章是对医疗保险损失分布拟合方法及过程的探究。首先要将得到的数据进行处理,介绍了对截断数据处理的方式。整理完数据后进行描述性地统计分析,得到样本特征值;绘制样本直方图、PP图、QQ图,帮助研究人员对数据有大致的了解。寻找医疗保险损失分布的方法有参数估计方法和非参数估计方法,所以笔者从这两个方面进行分层探讨和横向比较。损失分布的参数估计方法方面,归纳比较了常见的Beta分布簇和Gamma分布簇,及其相互转化关系。从中选择了医疗保险精算中具有代表性的Gamma分布、对数正态分布、帕累托(Pareto)分布等。由于医疗保险的损失分布都是右偏的,高额赔付对医疗保险的稳定性具有重大的影响,所以本文对以上几种分布的尾部进行了较为细致地比较研究,得出对数正态分布的尾部厚于Gamma分布厚于指数分布、Pareto分布右偏程度较明显、指数分布具有“记忆性”不适合医疗保险损失等重要结论。根据这些损失分布的先验知识和前面的数据分析,初选几种损失分布模型。对其进行拟合优度检验,未通过的给予淘汰;通过检验的模型,我们对其未知参数进行估计。拟合优度检验的方法主要有剩余期望函数的趋势判定法、χ2检验、K-S ( Kolmogorov-Smirnov )检验等,本文进行了较为详细地分析,比较了各自优缺点,在此基础上推荐χ2检验方法进行拟合优度检验。未知参数的估计方法主要有矩估计法、极大似然估计法、分位点法、最小距离法、最小χ2法、贝叶斯估计以及MCMC方法等七种重要方法。本文逐一阐述了这七种方法的原理,总结了其优缺点并比较了其使用环境。由于极大似然估计具有许多优良的性质,在取得相似效果的情况下操作的方便性,本文极力推荐该方法对未知参数进行估计。对模型的未知参数进行估计之后,再对模型进行拟合优度检验,选择拟合较好的模型。所以拟合优度检验既是参数估计方法的开始,又是参数估计方法的结尾,扮演着不断循环的角色。如果选择的模型拟合得都不甚令人满意,存在过拟合或拟合不足的现象,可以选择混合模型进行“取长补短”,以叠加模型为代表。非参数估计方法方面。当数据较少,或参数估计方法拟合得效果不满意时,可以求助非参估计的方法。本文按照非参估计方法的发展历程,逐步介绍了直方图、Parzen窗密度估计、核密度估计法、k-近邻法,归纳了各自的基本原理,总结比较了这四种方法的优缺点。由于核密度估计方法性质的优良特征,本文实证分析部分非参估计采用此方法。所以本文理论部分着重对核密度估计进行了研究,包括其基本概念、核函数的选择、窗宽对估计量的影响、如何选择窗宽等。在以上基础上,总结了模型选择原则和各种判断标准。介绍了“吝啬(Parsimony)”原则、尽量地限制选择过多的初步模型原则,总结了如何利用统计量、统计数值来进行模型的最终判断和选择。最后,对本文理论部分的思路和构建进行总结,增强了本文的层次感。本章以损失分布拟合过程为主线贯穿各种参数估计方法,以非参估计方法的进展顺序总结研究各种非参估计方法,使本章结构一目了然。第三章是对医疗保险损失分布进行实证分析部分。本章以成都市某保险人群为对象,对其2004年的实际医疗费用数据进行分析,得到其数值特征。绘制QQ图得出总费用服从对数正态分布,这对制定成都市医疗保险计划有一定的帮助。根据性别和年龄将数据分成了12个组,对19岁以上的每个亚组分布分别进行拟合。本次初选的分布模型为Pareto分布Gamma分布、对数正态分布、Weibull分布。用极大似然估计方法分别估计各分布、各亚组的未知参数。用软件MATLAB进行非参数核密度估计,算出窗宽,进一步算出各分布的拟合频数,将其与观测频数进行比较,初步观测其拟合效果。绘制拟合密度图,使拟合结果更加明显。最后进行拟合优度检验,选择拟合效果较好的模型和方法。通过实证分析可知,通过核密度估计方法得到了较好的拟合效果,并获得了各亚组的期望值,为后续的定价工作打下了基础。本文主要贡献在于:1、本文对医疗保险损失分布拟合方法进行了系统地研究。国内对医疗保险损失分布拟合方法缺乏系统性研究。本文从寻找医疗保险损失分布方法的参数估计和非参估计两个方面进行探索,几乎涵盖了绝大部分拟合方法。可以说具有较大的贡献。2、注重理论与实践的结合。本文在对损失分布拟合方法探讨的基础上,对成都市某保险人群数据进行实证分析,得出相应的结果。对医疗保险计划的制定有一定的探索意义和参考价值。3、将核密度估计方法引入医疗保险损失分布领域,这在国内医疗保险的相关研究中还比较少见。由于时间和精力有限,本文存在以下不足之处:1、本文只对医疗保险损失中的个体损失分布进行了较为系统地研究,未涉及到聚合风险。2、各种医疗保险的损失分布拟合方法的适用环境还有待进一步挖掘。3、没有把医疗保险费用数据与社保基金数据结合起来进行对比分析。以上这几点都需要以后进一步探讨和研究。
其他文献
用友ERP—U8.72软件是当前广泛使用的企业管理软件,其供应链系统操作比较复杂,尤其是对于特殊的暂估入库业务中损耗的处理更为繁琐,本文设计了暂估入库业务中损耗处理流程图,
目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页
大约5000万年前,鲸类的祖先从陆地进入海洋,至3400万年前完全适应海洋生活。生活环境的转变使鲸类祖先面临着巨大的生存压力,以至于现生鲸类无论在生理还是形态上都发生了显
本文从行业发展的迫切需要,说明了工程管理专业加强建筑工程安全管理学习的必要性,通过对工作中存在的主要问题进行分析,就如何设置与优化安全管理内容,如何改进与完善学习方
文章以广西桂林鲁家村及芦笛三村为研究对象,通过实地调研发现桂林鲁家村及芦笛三村存在美食街空间布局发展不平衡、休闲农业观光旅游产品单一且不够深化、现有资源未充分发
本文采用正交试验方法,优选了适合于蜡壳包装机生产的蜡壳配方。即:食用石蜡2.95kg、聚乙烯125g、松香550g、钙化松香550g、凡士林250g、蓖麻油150g。优选后配方制成的蜡壳,
胆甾醇对昆虫发育至关重要,它是细胞膜的重要组成部分和合成蜕皮激素的前体。昆虫自身不能合成胆甾醇,必须从食物中摄取。植食性昆虫可将植物甾醇转化为胆甾醇,肉食性昆虫从
本文依托于实验室设计的双目立体视觉空间坐标测量系统,该系统应用于地形复杂多变的山区,整个系统内使用了超过20台摄像机,总监测面积超过5平方千米。针对该系统监测范围大,
目的比较5种分析方法测定齐墩果酸的含量。方法①酸碱滴定法;②可见分光光度法(Vis):香草醛-冰醋酸-高氯酸溶液为显色剂,在548nm波长处测定;③紫外分光光度法(UV):溶剂为甲醇
研制高效新型微波吸收与屏蔽材料是减少电磁污染、保护环境的有效途径。电磁参数(s-ε’-jε’.μr=μ’-jμ")和阻抗匹配是决定材料吸收性能的关键因素。这些参数取决于吸收