论文部分内容阅读
研究背景随着我国人口老龄化问题严重和医疗技术的不断进步,住院费用也随之快速增长,“看病难、看病贵”已成为我国卫生政策改革的重点和难点。而胃癌是我国消化系统中最常见的恶性肿瘤之一,由于发病原因不明确、病程长、易复发等特点,导致其医疗费用较高。目前对住院费用的研究方法大多采用统计学,或者是数据挖掘方法中的神经网络和决策树,而利用支持向量机对住院费用建模研究的文献较少。研究目的以胃癌患者住院费用分析为例,探讨合理的住院费用分类规则,设定合适的核函数和参数建立基于支持向量机的住院费用预测模型,衡量各因素对住院费用的影响程度,并采用遗传算法优化进一步提高患者住院费用的预测精度,为医疗决策者提供政策参考和住院费用建模的方法学依据。研究方法本研究以宁夏医科大学总院2009-2011年以及2013-2014五年的胃癌患者资料为样本,提出两种住院费用建模方法,基于聚类的信息粒化手段和支持向量机的建模方法,和在此基础上提出的基于遗传算法对支持向量机进行特征选择和参数优化的新方法,运用分类准确率、敏感性、特异性以及时间复杂度指标进行效果评价。研究结果针对第一种基于聚类和支持向量机的建模方法,实验结果表明通过K-Means以年份对费用聚类比单纯以费用分布特征聚类的分类准确率提高了13.13%,当核函数选用径向基核函数,且惩罚因子C=10和核参数g=1时建立的支持向量机模型最稳定,分类准确率为92.11%,明显优于2-logistic和BP神经网络的分类结果。针对第二种基于遗传算法的特征选择和参数优化的方法,实验结果表明,该算法能够快速找到合适的特征子集和支持向量机参数,并获得较好的预测效果。与其他优化方法进行对比,结果表明本文方法无论从分类准确率、敏感性和特异性都比其他方法要高,且时间复杂度最低,从而验证了本文算法的优势。