论文部分内容阅读
目的:根据良、恶性孤立性肺结节的胸部CT表现及特征,利用相关数据挖掘技术,设计一款计算机辅助诊断软件,并进行测试与评估。 方法:收集经手术或穿刺病理证实的肺内孤立性结节100例(SolitaryPulmonary Nodule,SPN),病理结果包括良、恶性肿瘤、结核和炎性假瘤。收集符合要求的每例患者的临床资料,包括性别、年龄、肿瘤史以及是否有痰中带血丝,对4个临床参数和12个CT扫描指标(包括形态特征,密度,邻近结构改变等)进行影像学分析、描述与量化,形成孤立性肺结节的数据集。根据肺结节的良恶性结果分为两类,即良性(0)和恶性(1)。随机选取60例作为训练集,40例作为测试集,统计10次结果。测试所选的决策树C4.5,贝叶斯网,支持向量机(Support Vector Machine,SVM)三种算法对肺结节良恶性的预测结果。利用准确度,敏感度及假阳率来计算实验结果。进行ROC曲线分析,以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,通过ROC曲线下面积S来评价准确度。利用SPSS17.0中的二元logistic回归分析,以良恶性为因变量,其它属性为自变量进行分析,分析各属性信息与良恶性结果之间的关系。 结果:本研究分别测试了C4.5,贝叶斯网以及SVM算法对肺结节良恶性的预测效果。采用敏感度,假阳率及准确度来衡量实验结果,统计10次结果。所选决策树C4.5,贝叶斯网络,SVM三种算法的灵敏度,假阳性率,正确率分别为74.4%、30%、72.5%、76.1%、21%,77.5%,80.9%、15.7%、82.5%。SVM算法具有较高的敏感性和准确性,以及较低的假阳性。进行ROC曲线分析,比较三种算法的ROC曲线下面积S,决策树C4.5,S为0.750;贝叶斯网络,S为0.755;SVM,S为0.825。三者都介于0.70-0.90之间,准确度达到中等水平,其中SVM准确度高些,达到中等偏上。利用SPSS17.0中的二元logistic回归分析,以良恶性为因变量,其它属性为自变量进行分析,发现边缘轮廓,毛刺,与血管关系,与胸膜关系这四种属性对于肺结节的良恶性诊断是有重要作用的。 结论:本软件能够在临床医生对肺内孤立结节的良恶性诊断过程中起辅助作用。计算机辅助诊断在孤立性肺结节的良恶性诊断中有一定的应用价值。边缘轮廓,毛刺,与血管关系,与胸膜关系这四种属性对于肺结节的良恶性诊断是有重要作用。