基于数据挖掘技术的肿瘤标志蛋白芯片在肺癌辅助诊断中的应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:stieyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的肺癌是一种严重危害人类健康和生命质量的恶性肿瘤,其发病率及死亡率近年来逐步上升、居高不下,如今已成为当今世界范围内最常见的恶性肿瘤之一。近年来肺癌的诊疗技术快速提高,然而因肺癌早期无特异性临床症状,一般不会引起患者重视,且临床缺乏对于高危人群的有效早期诊断方法,因而当患者有典型临床表现再就诊时,大多已属于晚期,所以临床治疗效果和预后都不令人满意。因此探讨及发展早期发现、早期诊断的有效方法,对于改善肺癌患者的治疗和预后与患者的健康及生命质量都有着重要的意义。血清肿瘤标志的检测是近年来新兴的辅助诊断肿瘤的常用方法之一,对肺癌的诊断、病情进展和疗效的观察等都有极大的价值。并且该方法具有检测结果定量客观、创伤小、标本易获得、可重复测定等优点。然而由于目前并未发现肺癌的特异性血清肿瘤标志,故有假阳性和假阴性的问题,为改善这一问题及提高对早期恶性肿瘤的阳性检出率,临床多采用多种肿瘤标志联合检测。血清肿瘤标志的联合检测的确能提供许多信息,然而也带来大量的参数,用一般的统计学手段很难做出正确的处理。决策树是用以提取数据内在规律并对新数据对象进行分类预测,其模型的灵敏度、特异度较高,便于临床证候诊断时的实际操作。人工神经网络(ANN)是应用与大脑神经突触联接的结构类似的模型对数据及信息进行处理的一种运算模型,可以很容易的解决具有大量参数的问题,为解决大复杂度问题提供了一种相对来说比较简单且有效的方法。本研究应用蛋白芯片检测技术分别测定血清中CA199、 NSE、 CEA、 CA242、 Ferritin、 AFP、 CA125、 HGH和CA1539项肿瘤标志的水平。将上述肿瘤标志利用新型数据挖掘技术和传统的统计学分类技术,抽取可用于肺癌辅助诊断的有效特征,建立决策树、人工神经网络、Fisher判别分析、二项Logistic回归分析4种适合的模型,探讨这几种模型对肺癌辅助诊断的特异度、灵敏度、准确度、阳性预测值、阴性预测值,并通过ROC曲线筛选最优模型,为实现肺癌的快速辅助诊断、改善肺癌治疗及预后打下良好基础。对象与方法1.样本2010年6月至2011年12月于郑州大学第五附属医院呼吸内科及肿瘤科,收集有肿瘤标志蛋白芯片检测结果的肺癌患者202例、肺良性疾病患者201例。所有样本经过细胞学或病理学诊断。2.血清肿瘤标志的检测采用浙江湖州数康生物科技有限公司生产销售的肿瘤标志定量检测试剂盒测定血清中Ferritiin、 AFP、 CEA、 NSE、 CA199、 CA242、 CA125、 CA153和HGH9项肿瘤标志的水平。3.建立模型随机选取所有肺癌、肺良性的75%作为训练集(肺癌、肺良性各150例),分别用决策树、人工神经网络、Logistic回归和Fisher判别分析建立合适的模型,然后用所有样本作为预测集(肺癌202例,肺良性201例)检测模型优劣。用筛检实验的评价指标和ROC曲线比较4种模型对预测集样本的预测效果。4.统计学分析采用SPSS12.0和Clementine12.0软件。定量资料应用非参数检验的两独立样本检验,用中位数和四分位数表示结果;定性资料比较用χ2检验;检验水准α=0.05。结果1.9项血清肿瘤标志中,肺癌组CA153、Ferritin、 CEA. NSE、 AFP、 CA125、CA242水平显著高于肺良性疾病组,差异具有统计学意义(P<0.05);AFP、CA125、 CA19-9、 CEA、 NSE、 CA242、 CA153、 Ferritin在两组中的表达阳性率差异有统计学意义(P<0.05)。2.4种模型分类结果决策树模型结果:灵敏度为92.08%、特异度为92.54%、阳性预测值为92.54%、阴性预测值为92.08%,对预测集分类的准确度为92.31%,RUC为0.923。ANN模型结果:灵敏度为83.66%、特异度为88.56%、阳性预测值为88.02%、阴性预测值为84.36%,此模型对测试集分类的准确度为86.10%,RUC为0.861。二项Logistic回归模型结果:灵敏度为75.74%、特异度为86.07%、阳性预测值为84.53%、阴性预测值为77.93%,此模型对测试集分类的准确度为80.89%,RUC为0.809。Fisher判别分析结果:灵敏度为63.86%、特异度为89.05%、阳性预测值为85.43%、阴性预测值为71.03%,此模型对测试集预测分类的准确度为76.43%,RUC为0.765。结论1.利用数据挖掘技术联合多肿瘤标志蛋白芯片建立的模型可以快速鉴别诊断肺癌和肺良性疾病。2.决策树和人工神经网络模型对肺癌和肺良性疾病的鉴别诊断效果优于Fisher判别分析和二项Logistic回归模型,其中决策树鉴别诊断效果最优。
其他文献
上饶县讯 日前,上饶县第三次全国文物普查领导小组在普查过程中,在茶亭镇包家村发现一古代采金矿遗址。后经省博物馆有关专家现场考察,初步认为这个大型金矿遗址开采年代至少在
报纸
下肢静脉曲张是血管外科常见疾病之一,是许多不同病因所导致的一种共同临床表现,据统计成年人群发病率为9.08%。传统的大隐静脉高位结扎和主干分段剥脱手术治疗效果肯定,但创
期刊
在全球化时代,时空距离的缩短给城市注入新的活力和更多发展的可能性。为实现长期可持续的发展,增强自身的竞争力,许多城市均透过多样的创意手法,开展城市形象传播,塑造城市
遵循因材施教的原则,面向全体学生,分层设计数学作业,让不同的学生做不同的数学作业,每个学生的数学能力都能得到充分发展。
微课是以教材知识为内容,紧密贴合教学大纲和教学要求所制作出来的微型课程。音乐作为一门艺术类学科,它对学习者的音律敏感度、画面想象力、演唱表现力都有较高要求。在音乐课
学术能力是指进行学术研究所必需的知识层面和经验层面的素质和能力。学术能力包括,对于学科专业理论知识的认知能力、分析问题解决问题的科研能力。学术能力发展过程指对学