面向非均衡数据的糖尿病并发症预测

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:haofan555888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]针对糖尿病并发症数据样本不均衡带来的分类器刻画能力不足和决策边界偏移问题,探索合适的分类器模型,提高糖尿病并发症预测的效果.[方法]在数据层面,使用改进的SMOTE算法(F SMOTE)改变不均衡数据的类分布;在算法层面,用平衡准确率、ROC和PR曲线下AUC值共同作为评价指标,对比分析4种单分类器学习模型和4种集成学习模型.[结果]在准确率、ROC、PR指标上,采用F SMOTE算法比SMOTE算法的预测结果分别提升了 1.49%、3.43%和8.05%;采用集成学习模型比单分类器学习模型的预测结果分别提升了 9.73%、14.07%和46.79%,其中结合F_SMOTE算法和随机森林模型在面向非均衡数据时的预测结果分别可达到97.64%、98.91%和96.64%.[局限]未能覆盖全部的糖尿病并发症,模型训练的时间效率有待进一步提升.[结论]该方法在为数据挖掘人员提供多角度分析预测框架的同时,也可辅助医生进行疾病诊断和预防.
其他文献
[目的]提出一种划分模型解决微博热点话题下用户群体分类问题.[方法]从情感分析的角度入手,采用情感词典的方法计算用户文本情感值,并将文本情感值与用户文本向量表达相结合
[目的]从更具专指性和表征能力的短语语义表示角度,设计基于短语表示学习的主题识别及其表征词抽取方法.[方法]基于依存句法分析抽取短语构建短语序列,并将短语序列视作词序
[目的]以基本科学指标(ESI)Top1%高被引论文为对象,研究中国国家自然科学基金资助论文的高被引率变化情况.[方法]对比分析中国国家自然科学基金与美国主要基金、国内其他基金
[摘 要] 专业是高职院校人才培养的基本单元,课程是专业内涵建设的核心,课堂教学是课程实施的主阵地,是人才培养质量生成的教学一线。专业、课程、课堂三者之间具有内在逻辑关系,合理构建三者的联动机制,可使人才培养方案、课程标准、教案环环相扣,提高人才培养质量。  [关 键 词] 专业;课程;课堂;联动机制  [中图分类号] G712 [文献标志码] A [
医药类高校“课程思政”建设对于高校落实“立德树人”的根本任务,培养德才兼备的医药学人才有着非常重要的意义.医药类高校应在课程教学中充分挖掘思想政治教育资源,将专业
[目的]基于眼动实验分析在线健康信息可读性对用户认知负荷和信息加工绩效的影响.[方法]构建具有高/低可读性的两组健康信息网页作为实验刺激材料,检验在线健康信息可读性对
[目的]为解决生成新闻线索时抽取新闻主题及度量子事件相关性困难的问题,通过动态滑动窗口的方法改进主题模型,提高长文本和短文本新闻主题抽取的质量,并基于抽取出的新闻主
自媒体时代背景下,高职院校德育逐渐从课堂教育转为生活教育,将自媒体运用于德育工作中,是时代发展对德育提出的必然要求.鉴于此,解读自媒体的概念及特征,并分析自媒体为高职
新时代背景下,党和国家对高校思想政治教育工作的建设与指导作用高度重视,为了进一步促进高校思想政治教育工作的创新发展,有必要积极探索高校思想政治教育的新方法和新途径.
【目的】提出新的在线短租平台信任计算框架,提供多组低维信任特征供用户选择展示个人信息,缓解隐私保护造成数据缺失导致无法评估信任的问题。【方法】融合图像和文本数据分析,使用进化算法结合粗糙集特征选择算法获得多组信任特征。【结果】新信任计算框架在保持信任预测精度不变情况下,信任特征降维后,维度约为原特征集的5%。【局限】仅对国内代表性平台进行数据分析,可扩展到国外平台数据。【结论】图像和文本分析为在线