基于机器学习的乳腺癌新辅助化疗辅助诊疗系统的设计与实现

来源 :西南大学 | 被引量 : 0次 | 上传用户:pengxiubin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌是一种常见于女性的恶性肿瘤,数据显示,2020年全球乳腺癌新增病例高达226万例,首次超过肺癌的年新增病例数,成为世界范围内年度新增病例最多的癌症。自20世纪90年代以来,中国乳腺癌发病率的增长速度是全球增长速度的两倍之多,目前乳腺癌已成为中国女性发病率第一,死亡率第五的癌症。长期快速增长的发病率,使得国家和社会所面临的经济负担与健康压力日益加重。所幸的是,与其他癌症患者相比较,乳腺癌患者的预后较好,通过积极的全身性、系统性治疗可以有效提高乳腺癌患者的生存率。新辅助化疗是现代乳腺癌治疗中一种重要的治疗手段,可以有效的提高患者的生存率与生存质量。但是新辅助化疗需要2-4个周期的治疗,才能确定患者对新辅助化疗的敏感性。相关研究数据表明,10%-35%的患者对于新辅助化疗不敏感,5%的患者病情甚至可能会进一步恶化,进行新辅助化疗直接延误了此类患者的治疗时机。另一方面,随着信息技术的快速发展,运用机器学习算法来预测患者对新辅助化疗的敏感性成为可能,在此基础上运用软件开发技术构建乳腺癌新辅助化疗辅助诊疗系统能够辅助医生决策,提高患者生存率。本研究致力于开发一套乳腺癌新辅助化疗辅助诊疗系统,其核心是使用机器学习算法建立预测模型,对乳腺癌患者的新辅助化疗敏感性进行预测。首先,采用缺失值填充、特征选取以及数据集的平衡处理方法对患者的病理数据进行预处理操作。其次,使用支持向量机、Logistic回归、随机森林、XGBoost四种机器学习算法建立初步的预测模型并进行测试,并根据F1-score与AUC指标选取预测效果最好的XGBoost模型。然后,结合网格搜索和SMOTE-NC过采样算法,提出GSCVSN模型优化方法,对XGBoost模型进一步优化。最后,引入Stacking算法的堆栈融合思想,将GSCVSN优化后的四种算法进行融合,得到最终预测模型GSCVSN-Stacking,从而达到乳腺癌患者的新辅助化疗敏感性精确预测的目标。本研究在GSCVSN-Stacking预测模型的基础上,设计并实现了乳腺癌新辅助化疗辅助诊疗系统,主要功能包括患者基本信息、病理信息、治疗信息的录入、患者信息查询、敏感性分析等。在辅助诊疗系统的构建过程中,使用Vue.js框架和Element UI来实现前端页面,使用Spring Boot和Mybatis-Plus来完成后端系统的开发,对系统进行功能性测试和非功能性测试,用以确保系统部署上线后的可用性。
其他文献
数据同化是指在考虑数据时空分布以及观测场和背景场误差的基础上,在数值模型的动态运行过程中融合新的观测数据的方法。它可以有效解决随机动力系统的状态及参数估计问题,应用领域包括大气科学、海洋科学、水文、自然灾害、全球定位系统、机器人和计算机视觉等。机器学习尤其是深度学习可以从数据中学习复杂的模式和非线性关系,根据已知数据给出预测或估计。目前已经在模式识别与图像处理、控制及优化、通信、自动驾驶和机器人仿
随着国家提倡智能制造,越来越多的机器人等辅助分拣工具被用到分拣上面。但是大部分用到的机器人还是需要人工示教,并不能充分提高分拣效率和机器人的灵活性。将带有机器视觉的机械手技术,使用在物流分拣任务中会大大提高分检效率。如何让机械手移动到视觉系统识别出物体的位置,并准确抓取是本文主要解决的问题。对于上述问题,本文以VS2019作为开发平台,用LS3-B401S-V1爱普生机械手作设计了一套面向物流行业
智能工厂是智能制造的重要内容,而生产系统性能预测和评估是智能工厂生产控制和决策优化的基础。智能工厂利用传感器、物联网等技术实现物物互联、信息共享、服务协同等功能,其中利用采集的海量多源制造数据,挖掘出制造系统性能指标的演化趋势及数据间的影响规律,实现车间性能预测,有利于指导智能车间的运行优化和自主调控。因此,本文在智能工厂背景下研究基于数据驱动的生产系统性能预测,主要研究内容如下:(1)数据驱动的
现如今工业机械设备朝着精密化、自动化、大型化和系统化的方向发展,滚动轴承的微小故障就可能对大型精密机械设备造成重大损害。机械零部件故障的诊断与预测一直都是保障工业机械设备稳定运行的基本条件。滚动轴承作为机械设备中不容忽视的存在,其稳定运转更是保障机械设备安全运作的前提。鉴于滚动轴承在工业设备中的重要地位,轴承故障诊断算法应运而生。而传统轴承故障诊断算法对专家知识要求高,设计的诊断模型结构复杂,并且
疲劳状态下的驾驶(疲劳驾驶)是引起交通事故的主要原因之一,给人们的生命和财产造成了重大损失。因此,设计并实现一种能够对疲劳驾驶准确地做出预警的方法,对减少因疲劳驾驶导致的生命和财产损失有重大意义。脑电图(Electroencephalography,EEG)记录了人大脑皮层神经细胞的电活动,可以直接反映大脑的即时状态,避免人为主观因素的影响,所以被认为是最有效的精神状态检测方法。传统的基于EEG的
在如今的大数据时代,购物类、服装类以及生活服务类等电商推荐系统层出不穷,系统的搜索以及推荐能力成为支撑该系统的核心技术,如何推荐给用户最满意的门店、商品也是系统的主要功能之一。然而通过研究发现:一些电商平台仍使用数据库关键词模糊查询的方式,导致搜索准确率低下;推荐系统中数据库压力日益增加导致数据提取速度降低;基于传统机器学习的推荐方式逐渐无法满足千人千面的推荐。针对上述问题,本文从数据库、搜索性能
单井分层结果是制定油田开发方案的重要依据。由于地质构造复杂、软硬件技术受限、数据处理方式不当等原因,初始单井分层数据可能存在误差甚至错误,因此,越来越多的科研人员开始研究分层数据的质检方法,目的是保证分层数据的准确性。目前油田分层数据质检的主要方法是现场专家根据先验知识,选择合适的测井曲线对井重新分层,进而通过对比前后分层结果进行校验。经过对某油田数据中心调研发现,在当前分层数据质检过程中,存在分
随着数据规模不断扩大,将深度学习模型应用在大规模图数据上,有效地提升了连边预测的精度,在推荐系统、社交网络等诸多领域具备较强的应用价值与潜力。近年来,虽然已有学者在同构图上开展对抗攻击研究,但针对异构图的安全性研究仍处于初步探索阶段。本文针对应用面较广的异构图推荐系统展开安全性探究。同时,进一步将研究拓展到一般性的多重异构图嵌入模型攻击问题中,探索了灰盒条件下的投毒攻击策略,验证了异构图深度学习模
随着科学技术的不断发展,计算机的硬件性能有了飞跃性的提升,随之而来的就是人工智能热潮。机器学习是人工智能的重要分支,它被广泛运用于各种领域,并取得了极佳的效果。各种基于文本编程的开发框架,有效地降低了专业人员进行机器学习建模的难度,但对于非专业编程人员而言,他们依然面临着搭建、优化模型需要复杂的背景知识,以及数据预处理、模型训练等关键步骤中繁琐的编程实现问题。因此研究一种能够降低机器学习建模门槛的
时至新时代的当下,我国作为能源大国对能源的绿色可持续发展越发地重视起来,区域综合能源系统作为推动我国能源体系建设的有效形式也因此迎来了崭新的发展契机。为了保障系统的运行管理、容量配置、优化调度等工作有效开展,需要对系统中多类能源的用能需求进行精准预测。但是与普通能源系统单一负荷预测相比,因区域综合能源系统接入了各种具有紧密联系的能源系统,导致各类负荷之间衍生出了复杂耦合关系,而现有的单一负荷预测方