基于多分类器多因素融合的渐进式乳腺癌辅助诊断模型

来源 :东华大学 | 被引量 : 0次 | 上传用户:asdfghjka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智慧医疗是医学和人工智能的交叉领域,是近年来国内外研究的热点领域之一。通过机器学习的手段可以非常有效的缓解医疗资源不足和患者就医需求日益增长之间的矛盾。乳腺癌是当今女性最大的威胁之一,作为一种异质性肿瘤,乳腺癌诊断涉及人口学信息、免疫学、生物化学等方面繁杂的因素,判断依据复杂多样。在乳腺癌实际临床诊断中由于不同病程阶段对患者采用不同检查手段,同一时间不同患者检查项目往往不同。上述情况为乳腺癌综合诊断模型构建带来了巨大的挑战。本文在研究多种分类器和融合方法的基础上,构建了基于多分类器多因素融合的渐进式综合诊断模型,主要工作如下:(1)针对乳腺癌涉及理化指标繁杂,表述方式多样的问题进行了数据特征提取与选择。结合相关医学文献和现有数据,选取血常规、血液肿瘤标志物、免疫组化三项医学检查数据,利用LASSO和随机森林算法选取其中关键性指标,并参考专业医学资料印证其正确性。(2)针对乳腺癌数据种类多样的特点,分析了随机森林、决策树、K近邻、支持向量机、逻辑回归、LSTM六种基分类模型优劣性、关键参数等相关特性。通过实验对比各模型在包含人口学信息的血常规、血液肿瘤标志物、免疫组化数据上的分类性能,结果显示血常规最优分类器为RF准确率77.59%,血液肿瘤标志物最优分类器为KNN准确率82.92%,免疫组化最优分类器为SVM准确率84.18%。(3)针对乳腺癌检查数据之间数据分布特征、评价方法不同的特点,采用了多分类器融合的策略。实验对比分析了三类融合算法:投票法、平均融合法和基于多准则决策(Multi-criteria Decision Making,MCDM)的融合算法,结果显示MCDM融合算法在不同数据集上准确率均高于其他两种策略。(4)针对乳腺癌诊断涉及检查种类(因素)多样,不同患者检查项目和时间不同的问题,本文提出了渐进式两级融合综合诊断模型。设计了分类器级融合和渐进式因素级融合的两级融合结构,实现分类器和因素种类的灵活增减提高模型可扩展性。同时增加渐进式机制使得模型在数据特征大量缺失时依然具有很高的准确率,具有良好的鲁棒性。基于上海某三甲医院真实数据进行实验,结果显示本模型在全特征输入情况下准确率达到91%,在特征大量缺失时比没有渐进式机制的模型准确率高10%以上。(5)渐进式乳腺癌诊断系统的构建。在提供诊断功能的同时还提供了相应的数据可视化服务,帮助医生更方便的对患者进行诊断。
其他文献
工业活动中不停地产生着包括氮氧化物的各种有毒有害气体,而氮氧化物中除二氧化氮以外的气体均极不稳定,遇光、湿或热即变成一氧化氮及二氧化氮。这些气体的排放严重地危害着
随着教育改革的推进,化学教学与化学教育研究的关注点转向能力研究,其中,建模能力又是科学研究和化学学习中的关键能力。在建模能力的研究中,已有研究关注了学生的建模能力与
血常规是医学诊断与治疗中常见的临床检测项目,能够反映人体诸多生理、病理信息。但是,目前临床使用的血常规检测设备多基于流式细胞术和库尔特计数法,存在一系列固有问题,例
受原油黏度高,非均质性严重,油层厚等因素影响,渤海稠油油藏聚合物驱的效果远低于陆上稀油油藏的驱替效果。为了提高非均质稠油油藏聚合物驱效果,需要进一步认识稠油油藏聚合
排球是技战能主导类隔网对抗性项目,比赛获胜的关键在于进攻得分。发球技术是仅次于扣球的第2得分手段,不但可以直接得分,而且能够破坏对手的一攻。加强发球效果,已经成为高
钒酸盐基质的物理化学性质稳定,大部分钒酸盐基质通常在紫外光激发下能够发射蓝绿光,且能将能量有效地传递给激活剂离子,这些优点使钒酸盐基质成为荧光材料研究领域的热点之
管道建设的高速发展对管道安全检测带来了新挑战,特别是工业管道,长期处于高温高压、有毒有害、易燃易爆的气体、液体输送状态之中,管道一旦受损,轻则因泄漏而导致资源浪费,
环形器是一种具有各向异性的微波器件,被广泛应用于雷达、微波通信、无线通信以及无线局域网系统的射频前端部分,实现收发双工之用。传统的环形器采用铁氧体材料,多为三端口,
近几年来,100G光模块大量投入使用同时,各大公司与研究机构将目光投向了400G甚至1T光传输研究中。其中高阶编码调制技术是提高传输系统容量的重要手段。高阶编码调制对光调制
未来战场将会有大量的军用地面移动机器人装备部队,多机器人协同问题变得越来越突出。多机器人相对定位和绝对定位问题是多机器人协同领域面临的难点之一,而基于多机器人协同