论文部分内容阅读
心血管疾病是一种多发的慢性疾病,在给患者的身体健康造成了严重的影响的同时,为社会和患者带来了沉重的医疗负担,对心血管疾病进行快速高效的预测将有助于患者及时发现疾病。由于在对患者病情进行快速分类预测的情境下,患者的不同病情信息的获取需要耗费不同的时间,因此如何根据这些具有差异的时间耗费对患者的病情信息进行阶段性划分并对病情信息进行高效的利用对于心血管疾病的分类预测具有重要的意义。目前对于心血管疾病进行预测的研究主要集中于两个方面,一个是关于心血管疾病风险评估模型的构建,但是此类研究需要大量的患者作为长期的随访对象,不适宜于进行快速高效的研究;另外一个是将心血管疾病的预测问题抽象成为机器学习中的问题,利用机器学习方法对心血管疾病进行特征选择以及预测。然而目前的研究对心血管疾病进行快速高效预测的情境未进行较多的考虑。因此本文针对心血管疾病预测研究的特点,在考虑时间耗费的前提下,利用机器学习方法构建心血管疾病的预测模型,对心血管疾病进行快速高效的预测。首先本文基于时间耗费分阶段对心血管疾病的危险因素进行组合;然后,为实现对信息的高效利用,针对心血管疾病数据中存在不相关以及冗余信息的问题,利用随机森林方法进行特征选择,识别出各阶段危险因素组合中的关键危险因素;最后,本文利用支持向量机根据识别出的各阶段的关键危险因素对患者进行心血管疾病预测,并利用遗传算法优化支持向量机的内部参数,提升预测性能,得到在具有不同时间耗费的各阶段危险因素组合下的心血管疾病的预测结果,并对预测结果进行评估,为心血管疾病的快速分类预测提供借鉴和建议。本文利用提出的心血管疾病预测模型对冠心病的发生进行了预测,并将本文所提出的模型的预测结果与K近邻算法、Logistic回归、BP神经网络的预测结果进行了比较,比较结果显示本文所提出的模型具有更优的性能,验证了模型的有效性。