基于机器学习的疾病预测研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:ooo4zhgr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展和计算速度的提升,人工智能等热点技术不断取得突破和进展。同时医疗产业信息化产生了大量的医疗数据,使得人工智能技术与医疗健康的结合成为当下的研究热点。糖尿病作为威胁人类健康的九大疾病之一,有效地评估患者的再入院风险,可以辅助医生进行更好的决策,提高医院的医疗质量。同时还能节约医疗资源,降低医疗开销,有一定的现实意义。本文尝试利用机器学习技术,基于结构化医疗数据进行疾病预测,判断糖尿病患者出院后一个月内是否会再次入院。主要研究工作如下:(1)调研了基于机器学习进行疾病预测的主流研究方法,介绍了常用机器学习方法的原理与优缺点,常用的数据预处理方法,评价指标等。(2)分析了利用机器学习对结构化医疗数据进行疾病预测存在的两个难点,并针对这两个难点提出了相应的解决方案。针对结构化医疗数据中容易存在高维离散特征,传统机器学习模型难以学习的问题,提出了一种利用Word2Vec进行离散特征编码的方法。针对依靠研究人员手动设计特征成本高的问题,提出了一种基于统计信息的离散特征自动交叉方法。(3)针对上述两种特征编码方案,提出了一种基于特征嵌入的梯度提升树模型(Feature Embedding Gradient Boost Decision Tree,FE-GBDT)。(4)在公开的糖尿病数据集上,采用多种不同的机器学习方法对糖尿病患者的再入院进行预测,并对各个模型的实验结果进行对比分析。实验结果表明无论是在测试集还是五折交叉验证,FE-GBDT在各个评价指标的评估中均取得了最好的结果,验证了FE-GBDT的有效性。(5)对多种不同机器学习算法的结果进行模型融合,进一步提升了模型的精度。
其他文献
聚对苯二甲酸丁二醇酯(PBT)由于其自身优异的性能,被广泛应用于各行各业,但其回收利用率低,不符合现在低碳和环保的理念,因此研究易回收利用的高性能PBT复合材料一个非常具有研究价值的课题。类玻璃高分子(vitrimer)是一种具有动态交联网络结构的新型聚合物,在高温条件下,动态交联网络快速反应使网络的拓扑结构发生改变和重排,从而使得材料具有可重塑性和可再加工性能,这种性能使得vitrimer材料的
随着深度卷积神经网络(VGGNet、Res Net、Densenet等等)的不断发展,计算机在处理常见的粗粒度图像分类的效果已经越来越准确了,在大量的分类任务中甚至已经超过了人工的分类的精度,继而很多学者和研究人员逐渐地将研究的目光投向了细粒度图像分类任务。然而直接将这些深度神经网络用于细粒度图像的分类并不能得到很好的效果,主要是因为这些细粒度的图像之间是具有很多相同的地方,直接使用这些深度卷积神
语音是人类最基本、最重要、最快捷的信息交流传播方式。语音中不仅包含着说话者表达的内容,还包含着说话者丰富情感信息。随着大数据时代的到来,语音情感识别成为非常活跃的研究领域,在人机交互系统方面具有潜在的应用。语音情感识别作为人机交互系统的重要组成部分,其目的是通过直接的语音交流与机器形成情感互动。但是,由于情感的复杂多样性,语音情感识别是一项非常具有挑战性的工作。在语音情感识别研究中,研究主要内容是
随着经济全球化以及数字经济学的迅速崛起,推动了全球经济的快速发展。股票市场作为金融行业中最为重要的一部分,对经济的波动有着重要影响。股票价格涨跌的不确定性、难预测性和高回报高风险性,激起了众多学者的研究热潮,更受到了广大投资者的关注与追捧。如何提高股票涨跌预测的变化趋势成为众多学者与投资者最为关注的热点,因此,对金融趋势预测技术模型的研究与设计不仅具有深刻的理论意义,也具有非常重要的使用价值。由于
城市道路交通堵塞及事故的频发,给市民的交通出行和社会生产带来极大的困扰,尽管诸多的城市管理者对解决当前问题做了很多不同的尝试,但这些现象依然存在于各个城市中,且呈现上升趋势,如何在现有的交通设施基础下有效的提高城市道路的运行效率及管理能力是当前交通运输领域的主要难题。城市路网中无时无刻有网约车在运行,包含大量全面的城市交通时空信息,而且GPS数据具有可靠性高、数据量大等特点,采集到的数据通过无线网
长期以来,细粒度图像分类作为传统图像分类的一个细分方向,在现实世界的场景中有着广泛的实际应用需求。细粒度图像分类追求更加细致的类别划分,比如,输入一张鸟类的图像,可以对目标物体的具体子类别进行准确识别。显而易见的,细粒度图像分类相比传统意义上的图像分类提出了更高的要求。细粒度图像分类问题最大的挑战在于样本的类间差异小、类内差异大。为了解决这个问题,聚焦于近年来使用深度学习方法在细粒度图像分类问题上
目前人脸识别技术以及红外测温技术非常成熟,但对于人脸存在遮挡物的识别和口罩佩戴检查识别方面的应用场景,目前仍处于发展的阶段。目前在实际应用工程应用当中,面对复杂的室内外环境因素下,对人脸身份识别及配合红外非接触式测温装置的进行体温测量,仍存在一些关键技术问题,亟待科研人员和工程师共同解决:如对于人脸的关键点进行定位;判断人脸特征(如否佩戴好口罩)进行实时检测识别;在室内外进行非接触式测温精度控制和
随着移动智能终端的快速普及和物联网技术的快速发展,人们对于位置感知需求的应用急剧增加,定位服务作为移动互联网应用程序的一部分,深刻的影响着人们的出行的各个方面。近年来,随着室外定位技术的日渐成熟,总体净利率在逐年下降,而室内定位的需求却在不断增长,巨大的商业价值驱使人们更加关注室内定位技术的发展,其中,Wi-Fi(Wireless Fiedelity,无线保真)室内定位技术凭借基础设施部署广泛和终
科技的日异月新催促着各行各业的蓬勃发展,互联网作为社会的领头羊,与各行各业无时无刻连接在一起。伴随在传输、基础设施、计算能力都获得快速提升的基石下,智能互联网也因此诞生。手机作为人与互联网的一个重要接口,每天都会在其上面留下大量的行为数据,这些数据维度极其丰富且具有较强时效性。在互联网业务场景中,如何对用户画像进行高效预测是目前各大公司研究的核心问题之一。传统的用户画像都是以人工打标签为主,其效率
全球计算机与数字通信技术发生了翻天覆地的变化,在信息的传播和获取变得非常方便的同时,多媒体信息遭受着许多的攻击,信息的安全也变得尤为重要。人们对于知识产权的保护意识也越来越强烈,发布到网络上的多媒体的版权问题也越来越多。国内外许多专家和学者对此提出了各种有效的方法,保护多媒体版权信息大多采取了数字水印技术,该技术近几年在国际上得到了广泛的应用与研究。数字水印是一种新的保护手段。以语音和文本类的数据