论文部分内容阅读
支持向量机是在统计学习理论的基础上发展起来的新一代机器学习算法,它基于结构风险最小化原则取得实际风险,有效地提高了算法泛化能力,具有适应性强、推广能力强、解的稀疏性等优点,从而被广泛应用于文本分类、手写识别、图像分类、生物信息等领域.目前,虽然支持向量机已经取得了飞速的发展,但是作为一种尚未成熟的新技术,仍存在着种种局限.如果支持向量机的训练样本中含有不同于随机信息和模糊信息的另一种不确定性信息,即未确知信息,那么传统支持向量机的性能将变得非常微弱甚至无能为力.
因此,本文提出一种针对训练样本集中含有未确知信息这一情况的算法——未确知支持向量机.首先,对支持向量机的基础理论和构造原理进行分析和研究.其次,介绍未确知数、未确知事件的可信度以及未确知机会约束规划及其解法.接着,构建线性和非线性未确知支持向量机.利用未确知理论,给出一种特殊的处理未确知信息的方法,从而将未确知分类问题转化成已经解决并可以求解的未确知机会约束规划形式,然后进行求解,并就这两种模型,给出具体的算法流程.最后,将未确知支持向量机应用于亚健康模式识别中,并和半监督支持向量机在此问题上的试验结果进行比较分析.试验结果表明,本文提出的未确知支持向量机能够更好地解决训练样本集中含有未确知信息时的分类问题.