论文部分内容阅读
支持向量机(SVM)在分类算法原理中基于结构风险最小化的优越性使得其应用领域越来越广泛。其顺次最小优化算法(SMO)比传统的块算法和固定工作样本集的迭代优化算法具有更好的时间复杂性和空间复杂性。虽然SVM是专门针对有限样本发展起来且不依赖对所解问题先验知识的分类算法,但是在实际应用领域中往往对样本的需求量仍然很大。目前已有研究证明在一些应用领域中专家知识在理论上可以代替样本不足的问题。
本文提出了引入先验知识的支持向量机模型即加权度量支持向量机WM-SVM(WeightedMarginSVM),通过对训练样本引入先验信息量而减少所需的样本数量,同时提出了相应的WM-SMO算法,基于LIBSVM2.6和C++语言编写实验程序并应用于中医证候分类。实验数据来自广东省中医药管理局资助课题“中医证候信息数据库系统的设计与开发”中的中医证候数据库。首先通过专家所提供的中医证候专家知识规则对训练样本集进行置信度的计算,然后使用WM-SMO算法训练WM-SVM并测试。实验结果表明WM-SMO是一种对SVM在具体应用问题下更有效的算法,它能把应用背景中的先验知识与训练样本中的信息量很好地结合起来,在中医证候分类有专家知识的情况下,分类的正确率比原有SVM有较大的提高。