论文部分内容阅读
统计学习理论是研究小样本背景下机器学习规律的理论,它为解决有限样本学习问题提供了一个统一的框架。支持向量机是在统计学习理论基础上发展起来的一种通用的学习方法,具有全局优化、适应性强、理论完备、泛化性能好等优点。支持向量机基于结构风险最小化准则来提升泛化能力,在处理二分类、非线性、小样本等问题上比较完善,同时较大程度地解决了“维数灾难”和“过度学习”等困难。随着科技的发展,种类多变、分布不均匀、海量信息等干扰因素的增加,给多分类问题的处理带来了一定的困难。因此研究一种新的多分类模型,将粒计算思想、哈夫曼树、支持向量机结合实现模型构建,从而提高分类的效率和精度。首先,将粒计算理论融入到多分类问题中,应用粒三元论思想对具体问题进行观察、定义与转化,利用粒计算的分层思想,建立粒结构并进行粒度的粗化与细化,计算粒度。从不同角度对数据进行处理和分析,进而解决海量数据和训练速度低下等问题。其次,依据粒度排序,构造哈夫曼树,解决类内样本分布不均与分类效率低等问题。利用哈夫曼树带权路径长度最短的特点,使之能在最短的时间内归属类别,并用VC++6.0编程实现了哈夫曼树的构造,得到哈夫曼编码。最后,对决策树的粒进行分析,设计每个粒对应的不同支持向量机分类器,构建全局多分类模型,利用MATLAB实现了模型训练和仿真,并运用实例验证了模型的科学性和有效性。图17幅;表9个;参61篇。