机器学习在甲状腺结节良恶性诊断中的辅助分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:jiachengpu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
甲状腺结节性疾病是临床中的一种常见疾病,广泛存在于各年龄段人群中。临床上有多种甲状腺病症,这些病症可由甲状腺结节的物理特征初步快速诊断出结节的良恶性。目前医院辨别甲状腺结节良恶性症状的常用方法是影像学诊断法或化学诊断法,但它们有很高的误诊率。为此,本文基于这些诊断方法收集到的甲状腺结节物理特征数据,借助机器学习的理论和方法提出一个简单直观的辨别甲状腺结节良恶性症状的辅助方法,提高影像学诊断的效率。本文首先对收集到的临床数据进行数据预处理,特别是,采用最新的缺失数据处理方法对缺失数据进行填补。然后,借助统计学中的直方图和箱型图分析甲状腺结节良恶性病症与其它特征变量之间的关系,进而研究这些特征变量对甲状腺结节良恶性的影响。再借助这些特征变量与因变量之间的相关性检验,找出它们之间关联性较大的特征变量,然后再做随机森林算法分析得到影响甲状腺结节良恶性较多的几个特征变量,最后在前两个方法的基础上建立完整数据集的Logistic回归模型以及用缺失机制模型结合EM算法建立实际带缺失数据集的logistic回归模型。机器学习分析结果表明:物理特征甲状腺结节大小、纵横比、边缘与边界情况、甲状腺内部结构以及钙化情况对甲状腺结节的良恶性有显著的影响。而对于有缺失的实际数据进行EM算法分析可以说明所用估计方法的有效性,建立的logistic回归模型较合理。
其他文献
内蒙古巴彦淖尔获各琦铜矿3号主井为6绳摩擦式双箕斗提升,钢丝绳罐道,提升高度为1 100 m,是国内第一所千米竖井提升深井,且为井下出风风井,井筒湿度及粉尘较大。自投入运行至
入声是古代的一个调类,在今官话方言中都已消失,分派到平、上、去声中去了.就《方言调查字表》所列入声字对照兰银官话、中原官话陇中片方言、东北方言做了穷尽性的统计,比较
以2014年两次在陕西省乾县田间采集的129个黄绵土土壤样本为研究对象,建立土壤含水率定量反演模型。在土壤风干过程中测量光谱反射率及含水率,分析土壤含水率与光谱反射率之
例谈非谓语动词银南职工中专学校雷奋华英语非谓语动词有动词不定式、动名同、分词三种。动词不定式起名词、形容词和副词的作用,它在句中可作各种成分;动名词具有名词的特征,可
目的:建立舒眠胶囊HPLC指纹图谱,并结合化学模式识别方法对其进行质量评价。方法:采用Waters CORTECS C18(150 mm×4.6 mm,2.7μm)色谱柱;流动相为乙腈-0.1%磷酸溶液,梯度洗脱;
文化资源开发是一种综合性开发,是经济技术行为。在深刻分析武强县县域文化产业发展存在问题的基础上,提出确立主导品牌、构筑产业发展格局、加强宣传推介、完善产业链条、激活
政府支出的增加之所以能够引致居民消费的增长,是由于政府支出具有乘数效应。本文通过建立一个居民消费的跨期替代模型,分析了中国的政府支出与居民消费之间的关系,认为在短期内
通过分析秦皇岛体育产业发展的条件和优势,提出体育产业区域经济一体化、与奥运经济接轨、开展体育旅游等基本发展策略,以及适合秦皇岛现阶段体育产业发展的政府主导、产业优
综述了粗苯精制过程中产生的再生酸的性质、组成,并对近年来再生酸的各种净化及利用方法进行了比较.