基于特征工程的乳腺癌预测模型的研究与应用

来源 :广东财经大学 | 被引量 : 0次 | 上传用户:llllgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌是威胁女性生命健康的恶性肿瘤,死亡率极高。凭借医生的客观经验去判断患者的预后状态是远远不够的。本文在乳腺癌细胞数据集的基础上,提出了一种新的特征选择算法和非均衡数据处理算法,建立了一种新的乳腺癌预测模型来解决数据冗余和非均衡样本的问题,大致工作内容分为以下三点:(1)由于乳腺癌数据集因数据维度众多易产生特征冗余问题,所以提出一种基于Jaccard系数的mRMR特征选择算法。它是在mRMR的基础上结合Jaccard相关系数进行特征划分,选出相关性最高的特征维度。实验结果表明,该算法选择的特征子集维度小而精,分类性能较原mRMR算法提高至3%。(2)基于乳腺癌数据的良性细胞与恶性细胞比例差异显著,所以提出了基于改进的ODR和PFRF的非均衡数据处理算法。实验结果表明,相较于GBDT、Ada Boost、RF算法,改进的ODR-PFRF算法对少量样本的识别能力有了显著提高。(3)基于上两种改进算法,本文提出了一种新的乳腺癌预测模型,该模型分别使用J-mRMR、ODR-PFRF算法完成特征维度选择和非平衡数据均衡化,最后使用数据预处理后的数据集完成模型预测。实验结果表明,该模型能较好预测患者是否患有乳腺癌疾病。
其他文献
我国现有在役与少量在建公路独柱墩桥梁约1.5万座,约占公路桥梁总数的1.8%,具有分布广、部分区域存量较大的特点。因此,加强独柱墩桥梁养护管理,并对现役和在建独柱墩桥梁开展全面排查,对保障独柱墩桥梁运行安全具有重要意义。本文基于独柱墩桥梁横向倾覆原因与倾覆状态,对G75兰海高速贵阳段某交叉匝道桥实施抗倾覆加固措施并取得预期效果,以期对同类工程提供借鉴。
期刊
随着生活和工业应用中对电能需求的增大,传输电路承担着电力传输的重要职责,高压线路的传输变得越来越重要。电网公司在人机协同模式下进行巡检的过程中,由于遇到各种突发因素导致航拍的图像产生不同程度的失真耗损,影响地面人员检测和筛选的工作进度。因此,本文基于航拍超高压输电线路巡检过程中产生的失真图像,针对问题的特点引入图像质量评价方法(Image.Quality Assessment,IQA),实现对航拍
学位
目的 探讨利用互联网技术对冠心病合并心力衰竭患者治疗有效性的影响。方法 收集113例在我院心脏内科住院或门诊确诊的冠心病合并心衰患者纳入本次研究,随机分为两组,对照组行常规健康教育活动,定期门诊随访;试验组在对照组基础上,利用微信等远程技术手段,对患者实施全病程随访管理。比较两组患者临床治疗总有效率、治疗前后两组患者的心功能指标变化、以及缺血事件发生率进行比较。结果 试验组总有效率明显高于对照组(
期刊
学位
乳腺癌是影响全世界妇女健康的最严重疾病之一,因此开发一种能够在早期阶段发现乳腺癌的方法是非常迫切的。乳腺超声成像成本低、携带方便,因此它成为乳腺癌诊断的最重要方法之一。然而,超声图像的高噪声、低对比度和均匀性差的特性,使得乳腺超声图像分割仍然是一个极具挑战性的问题。目前,基于传统机器学习的分割方法,大多是通过提取图像小块的低层特征进行分类,进而实现分割。然而,这类方法未能有效利用乳腺超声图像中的高
学位
期刊
随着大数据时代的到来,银行的单一金融产品很难满足不同用户的需求,同时,传统的营销策略面临着严峻的市场挑战。因此,银行业迫切需要基于大数据驱动的精准营销来帮助银行寻找目标客户并为客户推荐合适的金融产品。有效地挖掘营销数据中的有用信息对提高银行核心竞争力显得尤为重要。本文是以公开数据集bank marketing营销数据集为背景,预测银行客户是否会认购定期产品为目的来进行研究的。主要工作如下:(1)构
学位
<正>为全面做好常态化疫情防控下的助企稳岗工作,江西省瑞金市财政局认真落实中央、省、市关于稳就业决策部署,坚持“就业是最大的民生”理念,聚焦稳市场主体稳岗位稳就业,精准落实落地相关政策,确保全市就业局势总体平稳。助企纾困稳岗就业。2022年以来,为企业减负养老保险费1502.76万元、工伤保险费255.55万元、失业保险费226.5万元,缓缴企业养老保险30.08万元、工伤保险0.52万元、失业保
期刊
<正>2022年以来,南充市营山县就业局全面梳理就业创业政策、服务举措、招工渠道等,成立由主要领导牵头、业务骨干组成的就业政策宣讲团赴中小学校、技能培训现场、党校课堂、城乡社区、经开区企业等场所,对培训学员、驻村干部、企业员工、社区群众等重点群体开展就业政策宣讲70余场次,促进重点群体更充分就业、更高质量就业。
期刊
燃气使用企业的增多,大大增加了燃气安全隐患。但经过大量走访与调研发现,大多数企业现有的燃气安全检测系统已难以适应与日俱增的数据模式,在数据的采集模块、存储模块以及时序数据的可视化模块的设计上显现出诸多不足。本文对传统的燃气安全检测系统进行改进实验,针对燃气采集数据的时序特性,设计并实现基于时序数据库的燃气安全检测系统以应对新形势下海量数据模式的需要。主要创新工作如下:(1)为应对燃气数据采集中出现
学位