基于多目标优化的特征选择方法研究及其在高血压预测中的应用

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:ytlytl1009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着老龄化时代的提前到来,老年人的健康问题引起了社会越来越多的关注,其中高血压等非传染性疾病已经成为威胁老年人健康的首要原因。为了降低老龄人口中高血压的发病率,近年来高血压的影响因素被广泛研究。临床医学和公共卫生领域拥有着各种各样与高血压问题相关的数据,以往对高血压影响因素的研究大部分是借用传统统计学方法,然而随着大数据时代的来临,传统统计学方法在高维数据建模中存在着较多的局限性;与此同时,机器学习算法开始兴起,随机森林等算法在各个领域中被广泛应用,但机器学习面对高维数据建模时也存在着一些困难,因而大量的特征选择方法由此诞生。特征选择常常被看作高维数据的必备武器,如何设计更好的特征选择方案以更好的处理高维数据问题值得探索。在这样的背景下,本研究提出了基于多目标优化的组合式特征选择方法。通常在组合式特征选择方法研究中,第一阶段特征选择数目的确定是人为设置的。本研究试图引入一个权衡指标,综合考虑特征选择法的稳定性和机器学习算法的拟合性能,给出第一阶段特征选择数目的筛选标准;第二阶段,多目标遗传算法利用第一阶段提供的特征子集作为初始种群,进一步进行特征选择,并同时优化特征子集的数目和机器学习算法的拟合性能。我们结合中国健康与养老追踪调查数据做实证分析,以预测高血压的社会影响因素为目标,验证基于多目标优化的组合式特征选择法的有效性以及引入权衡指标的合理性。实验运用四种不同的特征选择方法分别与多目标遗传算法组合,建立四种基于多目标优化的组合式特征选择方案。实验主要表明,组合式特征选择法比仅使用单一的特征选择法效果更好,即预测误差更小、特征子集的数目更少;验证了基于多目标优化的组合式特征选择方法的有效性以及第一阶段中引入权衡指标有一定的科学性及合理性。我们相信,组合式特征选择方法中权衡指标的引入,可以为今后组合式特征选择领域的研究提供一点探索思路。此外,该方法不仅能在预测高血压影响因素中使用,也可以在其他实际应用领域做出更多的尝试。
其他文献
【正】2006年7月中下旬.因峰峰集团公司机关水厂地下水源水质出现意外情况,造成机关供水区域内自来水中铁含量及浑浊度严重超标.给职工群众身体健康带来威胁.因此改善水质迫
装配图是表达机器或部件的工作原理和装配连接关系的图样。在产品设计中,一般先绘制出装配图,然后根据装配图绘制零件图。在产品制造中,机器、部件、组件的工作,都必须根据装配图来进行;使用和维修机器时,也往往需要通过装配图了解内部零件的构造等。因此,装配图在生产中起着非常重要的作用。
以近代"古今中西之争"为思想背景,冯契的智慧说既在一定意义上参与了"世界性的百家争鸣",也作为当代中国哲学的创造性形态融入世界哲学之中。通过基于现实基础的智慧追寻,冯
黄山学院本科毕业生肖安,以劳务派遣工身份进入上海的一家公司工作,并与劳务派遣机构和用人单位签订了协议,但无医保、福利等正式员工的待遇。据肖安介绍,尽管自己是本科学历,但入
期刊
第三届中国国际集约化畜牧展览会于2004年9月7~9日在上海光大国际会展中心举办.来自全球的业界精英云集上海,重塑畜牧辉煌,再奏展会华彩乐章.本届展览会的主办机构是VNU欧洲展
期刊