基于高斯混合模型的高维数据概率密度估计

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:wac725725
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概率密度估计是模式识别和机器学习领域的一个基本问题。它对于使用贝叶斯分类决策非常重要。高斯混合模型由于其强大的逼近数据分布的能力,是概率密度估计非常合适的建模工具。基于最大似然的EM算法是求解高斯混合模型的基本方法。然而,高维数据的概率密度估计由于样本稀疏等问题成为一个难题,即所谓“维数灾难”问题。特征降维可以有效地克服维数问题,然而如何将降维与高斯混合模型有机结合是一个问题。另一方面,高斯混合模型是一个生成式模型,每类参数是独立估计的,在训练中没有考虑分类边界,这样获得的模型不一定能够取得很好的分类效果,而鉴别学习能够提高模型的分类性能。针对这些问题,本文对高斯混合模型的结构及模型参数的鉴别学习方法进行了深入的研究,主要贡献如下:   (1)提出了一种共享子空间混合密度模型,它能够表示全空间的概率密度,并且子空间的计算和密度估计在EM框架下同时进行。每个高斯成分都表示成一个主子空间的椭圆高斯和一个补子空间的球面高斯的乘积。首先通过EM计算出全空间的模型参数,包括权重,均值和协方差矩阵,然后计算出共享协方差矩阵和共享子空间,将每个高斯成分降维到共享子空间。在共享子空间里,每个成分是一个椭圆高斯,而在补子空间,则通过一个共享的特征值来表示。为了提高分类性能,我们通过交叉验证的方式来确定补子空间的大小。在UCI数据集上的实验表明,我们提出的模型要优于以前的模型。   (2)针对子空间高斯混合模型,提出了一种鉴别学习方法。选择分类错误(MCE)作为鉴别准则,通过梯度下降对参数进行鉴别训练。首先通过PCA降维和EM算法得到模型的降维矩阵和高斯混合模型参数,把它们当做鉴别学习的初始值,通过梯度下降对所有参数进行更新,包括子空间参数和高斯混合模型参数。为了取得更好的泛化性能,我们引入了正则化学习,通过给目标函数加上似然函数的百分比来防止过学习。在MNIST数据集和UCI数据集上的对比实验表明,我们提出的鉴别学习方法分类性能不仅优于生成式学习方法,而且优于其他一些鉴别学习方法。   (3)EM算法能够估计高斯混合模型的参数,却不能确定混合成分的个数。我们提出了一种基于启发式交叉验证的快速鉴别模型选择方法来决定每类的个数。首先通过对手惩罚竞争学习方法来给出模型个数的初值,然后通过启发式交叉验证进行分裂或合并操作,最后通过验证集的分类错误率来确定最终的成分个数。由于在模型选择时考虑了鉴别信息,所选择的模型能给出更好的分类性能。将这个方法应用于USPS数据集和UCI的一些数据集,包括低维数据和高维数据。实验结果表明,在大多数情况下,我们提出的方法都能够给出更好的分类结果。
其他文献
随着互联网的蓬勃发展,网络媒体已逐渐成为人们获取信息的重要来源。网络媒体包括了大量的图片、Flash网络动画等多种媒体资源,如何对这些资源进行有效地管理,如何对这些资源进
本文主要针对排序学习的一些相关问题进行研究。由于排序学习重要的实际意义,因此已经得到了机器学习以及信息检索领域研究学者的广泛关注。排序学习是一个典型的非光滑优化问
在人的视觉感知、识别和理解中,形状是图像中目标的基本内在特性,是用于目标识别的重要特征,因此基于形状的图像匹配、目标识别方法研究具有重要意义。针对不同的研究目的,人
据有关资料统计,当今世界上共有5651种语言。语种之间的信息互通越来越重要,如何让计算机识别出不同的语种已经成为人们的迫切需求。语种识别(Language Identification, LID)
Hopfield神经网络是一种典型的递归神经网络,具有丰富的动力学特性,已经广泛地应用于各个领域。由于Hopfield神经网络的全连接递归结构,造成其存在网络结构非常复杂,难于建立大规
本文以实验室的冰箱为研究对象,综合研究了冰箱的食品保鲜、节能以及在兼顾冰箱的食品保鲜和节能下的优化控制。主要有如下内容:  首先,对冰箱的食品保鲜进行了研究。研究
两轮机器人是一个本征不稳定的欠驱动系统,并且具有多变量、非线性、强耦合和参数不确定的特点,其姿态平衡控制原理与人相似,又被称为原理性仿生机器人,让两轮机器人能够像人
光电吊舱是一个集光、机、电于一体的复杂系统,其近几年发展十分迅速,被广泛地应用于军事领域和公安、消防以及环境监控等民用领域。本课题对光电吊舱进行了深入研究,并根据未
统计参数语音合成具有输出语音平滑、连贯、鲁棒性高,系统构建快速、自动,可以灵活控制语音参数以及发音风格等优点,近年来在语音合成领域引起了极大的兴趣和重视,其中尤以基于隐
预测控制是20世纪70年代提出的一种计算控制方法,它主要由模型预测、滚动优化以及反馈校正三个部分组成。目前,基于线性系统的模型预测控制在理论上和实际应用中都已经比较成