论文部分内容阅读
影像组学是计算机医疗的重点科研方向,受到全世界政府、医院、高校的重视。影像组学的重点研究领域为癌症和肿瘤,脑胶质瘤是目前肿瘤精确诊断中存在较大难度的肿瘤病症之一,目前缺乏有效的影像识别方法对脑胶质瘤进行精确地分级评估。影像组学通过影像获取,肿瘤分割,特征提取,数据分析等步骤实现对肿瘤的分级预测。本文使用影像组学方法对脑胶质瘤进行分级预测研究。本文获取了两组脑胶质瘤影像数据,BRATS2017脑胶质瘤数据285例和河南省人民医院放射科脑胶质瘤数据161例,分别验证本文中的方法在科研方面的效果和临床应用方面的效果。所有影像由放射科医师手动分割,使用特征提取算法对肿瘤影像提取特征,共提取了包括强度、形状、纹理、小波等特征共357种。针对提取的特征,本文使用最小冗余最大相关性准则(mRMR)进行特征选择,并根据不同的特征选择数量使用LIBSVM和HLSVM算法进行训练和预测,结果显示使用mRMR选择的100个特征为最优特征子集。使用最优特征子集进一步实验,使用多种机器学习评价指标进行评估,并绘制出ROC曲线,结果显示HLSVM比LIBSVM在脑胶质瘤数据集上有更好的训练精度和更快的预测速度。使用十折交叉验证方法对最优特征子集进行实验,结果显示在训练精度和预测精度相差不大的情况下,HLSVM的速度比LIBSVM的速度大约快了一个数量级。根据两个数据集的实验对比,BRATS2017数据集是经过多个医疗机构和专家挑选的,影像清晰,分辨率高,肿瘤分割精准,与河南省人民医院的数据集相比具有更好的实验结果,但不具有广泛性。而河南省人民医院的实验结果显示使用两个分类算法的十折交叉验证平均预测精度分别为83.8235%和80.1102%,具有临床代表意义。分析实验结果后发现数据集存在数据不平衡问题,同时使用的支持向量机算法还有待提高,因此本文使用自适应合成采样算法对数据集进行过采样处理,并提出动态惩罚支持向量机,将两种算法相结合后的自适应动态惩罚支持向量机对脑胶质瘤进行分级预测,并取得了较好的实验结果,同时使用LIBSVM、HLSVM、DEC和FSVM进行对比实验。结果表明,该算法能够有效的提高不平衡数据集中少数类样本的预测精确度,同时大幅降低误诊率,G-mean指标显示该算法能有效处理脑胶质瘤数据不平衡问题。本文中所提出的分类预测算法和建立的预测模型对影像组学和临床医学有着重要的现实意义。