论文部分内容阅读
随着信息化技术的高速发展,在众多领域难免会出现高维数据,其中在模式识别领域,由于识别准确率的提高依赖于特征数据的全面有效,因此经常会出现高维特征,进而会造成所谓的“维数灾难”。为了避免出现“维数灾难”问题,对高维特征数据进行降维是十分必要的。数据降维即是对高维特征数据进行优化,使其在减少数据维数的同时,尽量除去冗余信息并且保留有效的信息,使得降维之后的信息损失最小。目前的特征优化算法虽然已经能基本满足降维需求,但这些方法却难以发现隐藏在高维数据中的内在低维信息,因此特征优化算法在模式识别领域仍存在难以被应用的问题。基于上述现状,本文提出了一种基于改进的稀疏表示的特征优化算法,并将此特征优化算法应用于肺结节良恶性诊断中。本文主要完成了如下几方面工作:(1)本文认真研究了大量特征数据降维的算法,分析了现有降维算法所存在的问题,详细叙述了稀疏表示的相关理论,揭示了稀疏表示算法相对于现有数据降维算法的优势所在。(2)本文分析了现有稀疏表示方法所存在的问题。其中典型的K-SVD字典学习算法由于具备良好的稀疏表示效果受到了广泛地应用,但其对高维数据内在特征的学习还不够充分,使得稀疏表示的效果并没有达到最佳。(3)本文对稀疏表示K-SVD字典学习算法进行了改进。在典型的K-SVD算法中,通常在稀疏分解阶段使用的是OMP匹配追踪算法,这里我们采用了一种改进的CoSpOMP算法进行稀疏分解,此算法相比于典型的OMP算法能够更有效的重复利用系数且收敛速度更快。在字典更新阶段,初始字典通常都是直接选取随机选取的信号排列而形成的字典,而本文则选取离散余弦矩阵作为初始字典,因为经过DCT处理后的信号能量是非常集中的。通过仿真实验表明,该改进的算法具有更好的稀疏表示效果且收敛性更强。(4)本文将提出的基于改进的稀疏表示的特征优化算法应用于肺结节良恶性诊断中。针对现有诊断技术中选取单层最大面积ROI特征导致的特征信息不够全面的问题,本文首先提取肺结节的相关多层切片的ROI高维特征数据,然后对高维特征数据进行稀疏表示,最后用支持向量机对稀疏处理后的数据集进行分类。实验结果表明,与当前存在的方法相比,本文提出的方法在基本保证诊断效率的同时,肺结节良恶性诊断的准确率、敏感性和特异性都得到了提高,而且使用改进的K-SVD稀疏表示特征优化算法相比于传统的K-SVD具有更好的诊断性能,说明了本文提出算法的有效性。