Bp神经网络与多重线性回归在住院费用中建模比较研究

被引量 : 12次 | 上传用户:wml889900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
改革开放30年来随着经济的快速发展,我国医疗费用不断增长,2007和2008年我国卫生总费用分别为10966亿元和14535.4亿元,根据《2009年我国卫生事业发展统计公报》预计2009年全国卫生总费用达16119亿元,人均卫生费用1192元。医疗费用快速增长成为全国普遍存在的问题,如何解决好这一问题,已引起社会各界的高度关注。有效地控制医疗费用上涨,尤其是住院费用的过快上涨,首先需要选择正确的数理统计方法分析住院费用的影响因素。以往对于住院病人住院费用影响因素的研究报道较多,分别运用相应的统计方法对住院费用资料进行多种分析处理,其中包括:采用不同多元统计方法探索住院费用的影响因素,并对住院费用发展趋势进行预测;对不同种类的住院费用进行分类等。传统的多元线性回归方法在分析住院费用中存在某种局限性,而BP神经网络由于其可以对线性或非线性多变量问题在不设前提条件的情况下进行统计分析,同传统的统计方法需要被分析的变量符合一定的条件相比有其自身的优点,故越来越多地应用于住院费用研究。人工神经网络(Artificial Neural Network,ANN)是一种模拟生物神经元工作方式的数学模型,在多个学科领域被广泛应用于模式识别,预报预测,数值逼近等问题。误差逆向传播神经网络模型(Back Propagation ,BP)是神经网络中的一种,因网络权值的调整规则采用误差逆向传播算法,即BP算法而得名,是神经网络中目前发展最迅速,应用最成熟的网络模型。由于BP神经网络对于资料的类型、分布等无任何前提条件,且具有一定的容错性,能通过自我学习,自我调整实现输入变量和输出变量之间的复杂映射关系,因此可以考虑将BP神经网络用于对住院费用及其影响因素进行建模,实现住院费用及其影响因素之间的关系拟合。研究目的:本研究通过对河北联合大学附属医院提供的住院费用病案首页资料,分别建立BP神经网络模型和多重线性回归模型,并对住院费用研究中拟合和推广能力及其适用条件进行比较,分析BP神经网络在不同变异资料中拟合和推广能力的稳定性,进而论证正确的住院费用预测方法。同时对BP神经网络建模过程中模型参数的优化进行探讨。同时以住院费用为例探讨因变量为连续变量,自变量为分类变量或连续变量和分类变量均有的非线性关系问题时统计方法的应用。资料与方法:本研究资料来自于河北联合大学附属医院提供的2006~2010年的A组急性阑尾炎(ICD10代码为K35)和B组糖尿病(ICD10代码为E11)病人的病案首页资料,共计病例数2317份。采用BP神经网络和多重线性回归分别进行住院费用的函数拟合建模,在建模过程中采用t检验和相对误差对不同统计方法进行比较分析,在己建立的BP神经网络模型基础上采用敏感度分析进行住院费用的影响因素分析。以上多重线性回归和t检验在SPSS13.0软件中进行,BP神经网络建模和敏感度分析均通过在MATLAB软件中进行编程得以实现。主要结果:一、模型性能结果对两组数据分别进行BP神经网络和多重线性回归建模,其结果如下:急性阑尾炎组结果为BP神经网络:训练集R=0.79,R~2=0.785;测试集R=0.72,R~2=0.704;多重线性回归:训练集R=0.598,R~2=0.357。糖尿病组结果为BP神经网络:训练集R=0.96,R~2=0.869;测试集R=0.51,R~2=0.499;多重线性回归:训练集R=0.685,R~2=0.443。二、BP神经网络和多重线性回归结果比较通过相对误差进行比较,配对t检验结果如下:急性阑尾炎组训练集t=3.63,P=0.000;测试集t=1.31,P=0.190,糖尿病组训练集t=9.65,P=0.000;测试集t=-5.29,P=0.000。三、BP神经网络在不同变异数据中的结果比较通过相对误差进行比较,独立样本t检验结果如下:训练集t=1.18,P=0.237;测试集t=-1.34,P=0.181。训练集相对误差均值:急性阑尾炎组0.31±3.60,糖尿病组0.12±1.08,差值估计0.183;测试集相对误差均值:急性阑尾炎组0.364±0.553,糖尿病组0.52±1.54,差值估计-0.156。四、敏感度分析结果敏感度分析显示:各影响因素的敏感度从大到小依次为:急性阑尾炎组:手术情况(0.27)、住院时间(0.224)、治疗结果(0.157)、住院次数(0.14)、次要诊断(0.058)、入院病情(0.048)、年龄(0.037)、职业(0.033)、费别(0.025)、性别(0.008),显示对住院费用影响最大的因素是手术情况,最小的是性别。糖尿病组:住院时间(0.348)、手术情况(0.162)、年龄(0.131)、住院次数(0.073)、治疗结果(0.072)、次要诊断(0.062)、职业(0.051)、费别(0.045)、入院病情(0.038)、性别(0.019),显示对住院费用影响最大的因素是住院时间,最小的是性别。结论:本次研究采用BP神经网络实现对住院费用进行拟合建模,通过对不同模型参数的设定选择可以达到优化模型的作用。BP神经网络与多重线性回归相比拟合和推广能力更优,性能更稳定。在变异较大的数据中BP神经网络由于学习过多的样本细节,预测能力下降。神经网络的拟合能力和推广能力不能两全,在建模时应根据实际情况对两者加以权衡。基于BP神经网络模型的敏感度分析可以用于住院费用影响因素的分析。基于理论分布的统计方法对资料类型要求严格,而应用BP神经网络来处理非线性问题能克服传统统计方法的弱点,为非线性问题的预测和影响因素分析提供一种较优的分析方法。由于本研究所选择的病案首页信息有限,因此建立的模型对住院费用预测的精度有限,可以提供一定的理论参考。BP神经网络由于不同的参数设定对网络的结果有不同的影响,如不同隐含层神经元数、不同初始权值和阈值等,目前仍缺乏理论上的支持,有待进一步研究。
其他文献
针对双回线并列运行时负荷电流不平衡,解列不平衡现象消失的问题,利用六序分量法进行了分析。分析出造成这种现象的原因是两回线参数不对称,在双回线中形成了环流不对称电流
自新中国成立以来,中国绘画沿袭了一定的传统艺术精神和绘画特色,但是在创作思想与文化思潮方面却产生了巨大的变革。中国表现性绘画融汇中西,西方绘画与中国传统文化不断冲
目的:评价晚期肺癌化疗患者实施心理护理干预的效果。方法:选取丽水市中心医院于2015年1月—2016年1月收治的64例晚期肺癌化疗患者,按随机盲选法分为2组,对照组32例给予常规
以高梁杂交种晋杂86-1为材料研究了种子吸水萌动过程中胚与胚乳两部分的水分状况及可溶性糖变化的过程。结果表明:在吸水萌动过程中种胚和胚乳在水分及糖代谢方面具有不同的特点。
收费公路政策作为缓解我国公路建设资金短缺约束、加快公路交通基础设施建设的重要手段,有力推动了公路交通运输业的发展,为满足国民经济发展及改善人们出行作出巨大的贡献。在
中等职业学校学生入学成绩低、基础差,语文教学质量的提高,要依靠广大语文教师,在课堂教学中利用多种方法,例如设计导语、讲述故事、组织活动等激发学生的学习兴趣,激发学生
目的:分析中西医结合治疗粉碎性桡骨远端骨折的临床效果。方法:将2013年1月-2015年1月盈江县中医医院收治的120例粉碎性桡骨远端骨折患者,随机分为实验组和对照组,各60例。实
在南华系钻孔编录与野外剖面观察实测的基础上,结合近年来报道的同位素年龄对渝东南与黔东地区南华系进行了梳理,并对其沉积环境进行了讨论。其中铁丝坳组沉积环境为地堑盆地
高中《思想政治》是一门政治性、思想性很强的学科。尤其高考政治主观题答题要求政治语言水平很高,文字运用和书写能力很强,集逻辑性、思辨性、情感性和政治敏锐性等素质于一体。概而言之就是对学生规范答题能力要求很高的一个高考板块。这种对学生规范答题能力的要求,根本上也是对政治课老师能力和素养的要求。教师在培养学生能力的同时,也必然要提高自己。高中阶段是人生成长关键期,高中阶段的教育教学对学生发展起着非常重要
机场是重要的交通中转站,其占地面积大、人流量大、设备复杂多样,保证机场的安全运转对于促进社会的稳定、带动不同地区之间的经济往来、保证人们的正常出行有着积极的意义。合