基于Logistic回归分析的返贫预测模型研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:coni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精准扶贫是我国全面建成小康社会的重要战略举措。随着我国扶贫工作取得显著成效的同时,不少贫困地区却长期存在着“扶贫、脱贫、再返贫”的怪圈现象。本文积极响应国家精准扶贫战略的号召,利用大数据分析技术,对我国脱贫户的返贫现象进行研究。在国家首个精准扶贫管理平台——甘肃省精准扶贫大数据管理平台的数据分析模块下,设计了基于Logistic回归分析的返贫预测模型。首先,对甘肃省扶贫办提供数据进行缺失值、异常值、数据变换等数据预处理工作,后续对返贫户的各项特征进行独立样本T检验,对显著性水平低于0.05的特征进行相关性检验,选取建模特征。其次,在Spark平台下,利用Logistic回归算法对现有返贫户进行分析,在不同比例训练数据下建立返贫预测模型,根据实验结果,对模型进行评估,选取预测准确率为86.43%的最优模型对2017年脱贫户进行返贫预测。最后,利用K-means聚类算法对预测出的返贫人群进行聚类,选取最优K值建立返贫人群聚类分析模型。通过聚类结果,观察各类返贫人群在各项特征上的差异,分析各类返贫户可能返贫的原因,对不同类别返贫人群成立相应的扶贫调查小组,制定有效、有针对性的帮扶措施,使脱贫户彻底摆脱返贫的厄运。
其他文献
本文讨论一种宽带无线IP系统。本系统创新性地把先进的射频(RF)、数字移动通信、计算机、宽带网络和软件等技术有机地结合在一起。使得接入因特网的方式更加方便、灵活,将有效地
目前,我国是最重要的锂电池生产与应用国家之一。经过长时间的技术研发,我国锂电池生产在能量密度和功率密度方面取得了明显进步,但是其中存在的问题也依旧突出。因此,将从目
基于当前大数据研究的热点和精准扶贫的业务特点,人民银行盐城市中心支行建立精准扶贫大数据计算服务平台。此平台基于分布式计算架构Hadoop,把全国扶贫库数据分布式存储在此