论文部分内容阅读
Kohonen提出的自组织映射(Self-organizing Map,SOM)是一种高效的智能信息处理方法。它的特点与人脑的自组织特性相类似,目前广泛应用于模式识别、数据挖掘、自动控制、图像处理和专家系统等领域。SOM网络是在无监督情况下学习的,即只需给出输入模式,无需确定所要求的输出结果,而由网络自动综合、归纳和统计,并调整权值矢量,以自适应响应不同信号模式。 传统(或改进)SOM算法直接用于三维信号(如立体视频图像)处理时遇到了如下挑战:首先,传统SOM通常采用一维输入层和二维映射层,能有效地将一维输入映射为二维输出,但无法有效实现二维输入到三维输出的映射。其次,一维到二维的映射与二维到三维的映射两者之间无论从信号相关性利用,还是从计算量、性能评价方法和实时性要求等,都存在较大差异。直接采用传统SOM算法难以有效地实现三维信号的非线性映射。然后,三维信号的数据量要比一维/二维信号大得多。例如三维立体图像的数据量较二维平面图像要大2倍以上,处理如此海量数据对处理速度、存储空间和实时性等提出了更高的要求。显然,需要对传统SOM算法进行深化研究和创新。 针对传统SOM算法直接用于三维信号处理存在的不足,本文研究三维自组织映射算法,并将其应用于三维立体图像压缩。三维SOM网络采用二维输入层和三维输出层的神经网络结构。研究了三维SOM算法的初始化算法、映射算法、竞争算法、邻域算法和学习算法。初始化算法通过方差找到使网络较快地收敛到全局最优解的初始权值;映射算法通过核函数将非线性映射转换为线性映射,以降低计算复杂度;竞争算法研究失真测度,提出新的“公平”竞争方案;邻域算法研究新的三维邻域形状和邻域函数;学习算法研究新的学习速度函数等来求解学习模型的全局最优解。 与传统SOM算法相比,三维SOM算法可以有效地压缩视差图,进而实现三维立体图像压缩编码。MATLAB仿真实验表明,三维SOM算法的重构图像具有较好的峰值信噪比(PSNR)和主观质量。通过GUI实现可视化压缩平台,对三维SOM用于立体图像压缩编码进行界面化展示。