慢性阻塞性肺病发病人数的预测模型

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yujia599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
慢性阻塞性肺病(Chronic Obstructive Pulmonary Disease,COPD)是一种常见的慢性呼吸系统疾病,这种疾病有较高的发病率和死亡率,给患者的生活造成严重的影响,并造成一定的经济负担和社会负担。一些相关研究表明 COPD与空气中的有害颗粒(比如PM2.5)和有害气体(比如SO2、NO2、CO等)有一定的关联。为了预测医院每周新增的 COPD患者住院人数,本论文以数据挖掘和机器学习作为研究方法,基于数据分析考察了每周PM2.5、SO2、NO2、CO的平均浓度对每周新增COPD患者住院人数的影响。然后选择合适的空气污染物因素作为预测变量,以平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)作为衡量模型的预测精度,通过探索和对比的方式逐步构建了一个预测精度较高的基于 K-means的局部加权线性回归组合模型,用于预测慢性阻塞性肺病的每周新增住院人数。本论文的主要研究工作和成果如下:  ①研究和分析了若干回归分析方法,并实现各算法来预测每周新增COPD患者住院人数。回归分析是一种监督学习,用于刻画预测变量和目标变量之间的关系,相当于变量之间的函数映射。回归分析主要有两个阶段,第一个阶段是模型的训练,也等价于函数拟合,即拟合已知数据;第二阶段是预测,基于训练所得到的模型,对新数据进行预测。本论文对比了若干回归分析方法在测试集上的预测精度,其中分类回归树算法在本论文的测试集中的预测精度最高(13.36%)。  ②提出了局部加权线性回归(Local Weighted Linear Regression,LWLR)组合模型。局部加权线性回归是一种基于实例的非参数学习算法,在预测方面有良好的效果。在很多机器学习方法中,组合模型的预测能力往往强于单一模型,本论文研究了两种组合方式:一种是组合具有不同核函数的局部加权线性回归模型,在该模型中对各单一模型的预测值进行动态加权;另外一种是对不同核函数进行动态加权构成新的核函数。这两种组合模型相比于单一模型都提高了预测精度,单一的局部加权线性回归能取得的最低预测误差是13.49%,而第一种组合模型获得的最低预测误差是13.34%,第二种组合模型获得的最低预测误差是13.38%。  ③提出了基于训练集二叉树的局部加权线性回归组合模型。由于局部加权线性回归模型在每次预测时都必须先遍历训练集的所有样本,然后在进行回归预测时只有少部分样本起作用。随着训练样本数量的增多,其计算量也会增加。为了减小计算量,本论文基于分类回归树的思想,构建了训练集二叉树。当本论文的局部加权线性回归组合模型与训练集二叉树联合时,由于训练集被划分成多个子集,而局部加权线性回归算法与训练集的容量大小成正比,因此该组合模型可以大幅度减小计算量,同时也降低了模型的预测误差(13.13%)。  ④提出了基于K-means聚类算法的局部加权线性回归组合模型。基于训练集二叉树的局部加权线性回归组合模型存在丢失预测点所需样本的问题,为了解决该问题,本论文以 K-means算法将训练集划分成若干子集,并由预测点根据实际情况自适应选取所需样本集,该方法大幅度提高了计算速度,同时提高了整个模型的预测精度。在聚类类别数为11时,该模型在测试集上的预测误差为12.08%。
其他文献
全球导航卫星系统发展到现在,在各个领域都广泛的应用。随着无线电技术的快速发展,很多行业都被规划了特定的频段,另外一些民用产业擅自使用频段,造成如今的电磁环境非常复杂
在无线终端与多媒体业务发展迅猛的时代,可用频谱资源已十分贫乏。认知无线电技术作为一项动态智能频谱管理技术,将是解决频谱资源日渐短缺、频谱利用低效等问题的关键手段。
近年来,随着传感技术、无线通信技术以及低功耗嵌入式技术的快速发展,无线传感器网络领域的研究在国内外众多科研机构迅速展开,并已经成为了业界关注的热点。目前,ZigBee协议
随着社会的不断进步,我国城市化建设的不断推进,各种大型公共设施随处可见。对于这些高密度人群聚集的场所,由于其在紧急情况下人群疏散工作存在很大的不安全性和不确定性,一
高压输变电设备是电网的重要构成元件,积极引入物联网技术,有助于提升设备监测诊断、运行管理水平,推进智能电网建设。无线监测设备作为物联网的核心部分之一,适用于长期、实时、大规模、自动化的环境监测。针对物联网络在变电站的应用,国内外开展了广泛的研究,但是这些研究都没有考虑变电站中无线物联网设备的电磁兼容性。由开关操作、雷击和故障产生的瞬态电磁干扰信号,含有丰富的高频成分,极易通过空间耦合对二次设备形成
随着计算机网络技术、通信技术、数字视频压缩编码技术的日益成熟,远程视频监控技术有了快速的进步,视频图像因其信息丰富,内容直观、使用方便而被广泛地应用于工业控制、交通监
说话人识别作为一种声纹识别技术,在模式识别应用发展迅猛的今天有着无可限量的前景,它与其他利用个人生物特征的识别方式相比,有着操作便捷、设备低廉的优势,因此近几年来,
随着信息技术的快速发展,网络上的资源共享让信息的获取变得更加的便捷。各种层出不穷的应用域包含了丰富的资源,各应用域之间的用户安全互访以及域间资源共享已经成为一种趋
随着Web应用的复杂性越来越高,传统的Web技术已不能满足人们更高的体验要求,Ajax正是为了满足这一需求而出现的典型应用,它同时继承了桌面以及Web应用程序的优点。然而,Ajax安全
人脸表情识别技术在人机交互和智能交通系统领域有着广阔的应用前景,是目前一个非常活跃的研究领域。该技术主要涉及两个方面的问题,如何有效地获取人脸面部表情特征以及如何