基于生成对抗网络的电子健康医疗数据生成

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wuqianlan987654
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在的电子医疗数据由于不同医疗机构之间的信息无法共享、医疗数据保密、针对某种疾病的病例较少等原因,很难获取大量的有效数据,而机器学习的算法需要大量的数据支撑,只有足够的数据,才可以进行有效地特征提取,并提高模型的泛化能力,在数据较少的情况下机器学习或者深度学习的模型都很难发挥其优势,为了获得足够有效的训练数据,我们可以采用数据生成的方法,生成符合实际数据特征的数据,并据此进行疾病诊断或预测模型的训练,这对机器学习或者深度学习算法在医疗领域的应用意义重大。本文以糖尿病和心力衰竭疾病数据的生成为例。一,利用生成模型对糖尿病和心力衰竭患者的数据进行生成,这是医疗数据生成领域的新尝试;二,本文将通过ICD-9映射而来的数据经过提取和处理之后转化为图片形式,因此可以采用一些在图像生成方面效果良好的模型来进行生成;三,在生成方面表现良好的GAN的基础上通过更改网络结构参数设计了本文的生成模型;四,采用了最近提出的在评估GAN生成模型上效果良好的分类器双样本检测来评估本文生成模型的质量;五,通过具体的疾病风险预测实验来进一步验证本文生成数据是否能够提高疾病预测的准确度,实验证明,本文提出的方法合成的数据可以提高疾病预测的准确度。
其他文献
<正>详细摘要:近年来,气候变化问题越来越受到关注,并已经从一个单纯的生态环境问题发展为社会问题和国际问题。包括中国在内的各国政府和国际社会都开始采取各种行动应对气
目的探讨无创产前基因检测(noninvasive prenatal genetic testing,NIPT)在胎儿染色体非整倍体疾病中的临床应用。方法选择2015年11月至2017年6月赤峰生殖健康专科医院确诊的
随着移动通信技术的发展,以TD-LTE为代表的4G网络的建设与优化正在不断进行,同时下一代移动通信系统5G的相关研发也正在积极推进。3GPP已经发布了5G新空口NR(New Radio)Relea
目的探讨超声诊断剖宫产瘢痕妊娠(CSP)与胎盘植入(PLA)的相关性。方法选取2017年6月-2019年6月于本院超声诊断为CSP并继续妊娠的患者15例作为实验组,取同时段具有剖宫产史并
减少沉降桩基础是现代桩土相互作用理论的巨大成果之一。它是一种新的基于沉降控制原则的桩基础 ,在上海地区得到了广泛的应用。本文介绍了其发展和设计原则 ,并对设计思想和
目的:通过SAS软件编写宏及其他程序保证统计分析报告中的报表输出能够达到准确、完整、规范的目的,并提高整个临床试验统计分析过程的效率。方法:完成统计报告自动生成大致可
背景与目的:癌症是世界范围内的一个主要公共卫生问题,已知的危险因素如吸烟、不良饮食、缺乏身体锻炼等不良生活习惯正增加癌症的发病风险。2018年美国增加1735350例新发癌症和609640例死亡癌症。肺癌是全世界发病率最高的恶性肿瘤,是导致恶性肿瘤死亡的主要原因。我国肺癌发病率和死亡率居恶性肿瘤第一位。实体肿瘤的主要治疗方式是手术切除,但肿瘤术后的复发和转移是影响患者生存率的主要原因。在肿瘤患者的
[目的] 探索尿β2-微球蛋白(β2-MG)含量在原发性膜性肾病患者预后及其治疗中的意义。[方法] 20例经肾活检证实为原发性肾病综合征膜性肾病患者,按照放免测定的尿β2-MG含量,将患
冠状动脉粥样硬化性心脏病合并左心室功能不全患者的预后与心室功能受损程度和功能异常节段心肌的活力有密切关系,冠状动脉粥样硬化性心脏病(CAD)患者左心室功能异常是心脏性死
目的 探讨胰源性脾静脉阻塞所致侧支循环的通路和相应侧支血管螺旋CT表现及其解剖学基础。 材料和方法 回顾性研究33例胰腺疾病病例,其中胰腺癌28例,急性胰腺炎3例,慢性胰