基于加权度量支持向量机下的分类算法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:datang0826
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(SVM)在分类算法原理中基于结构风险最小化的优越性使得其应用领域越来越广泛。其顺次最小优化算法(SMO)比传统的块算法和固定工作样本集的迭代优化算法具有更好的时间复杂性和空间复杂性。虽然SVM是专门针对有限样本发展起来且不依赖对所解问题先验知识的分类算法,但是在实际应用领域中往往对样本的需求量仍然很大。目前已有研究证明在一些应用领域中专家知识在理论上可以代替样本不足的问题。 本文提出了引入先验知识的支持向量机模型即加权度量支持向量机WM-SVM(WeightedMarginSVM),通过对训练样本引入先验信息量而减少所需的样本数量,同时提出了相应的WM-SMO算法,基于LIBSVM2.6和C++语言编写实验程序并应用于中医证候分类。实验数据来自广东省中医药管理局资助课题“中医证候信息数据库系统的设计与开发”中的中医证候数据库。首先通过专家所提供的中医证候专家知识规则对训练样本集进行置信度的计算,然后使用WM-SMO算法训练WM-SVM并测试。实验结果表明WM-SMO是一种对SVM在具体应用问题下更有效的算法,它能把应用背景中的先验知识与训练样本中的信息量很好地结合起来,在中医证候分类有专家知识的情况下,分类的正确率比原有SVM有较大的提高。
其他文献
目前,随着应用的快速发展和图像、音频、视频等多媒体信息传输的大量增加,Internet流量呈指数方式增长,对骨干路由器提出了越来越高的性能需求。在Internet发展初期,路由器大多基
实时集群计算机系统,通过系统负载平衡和实时调度机制实现了数据处理任务的实时性高度分配,有很高的性价比。实时集群服务器是集群领域最新也是极具挑战性的研究方向,如何将集
学习对象(Learning Object,LO)是远程教学的一个研究热点,自H.Wayne Hodgins于1994年提出学习对象之后,学习对象取得了长足的发展。2000年IEEE P 1484学习对象元数据工作小组
互联网的飞速发展带来了网络通信量的剧增,这不仅要求网络设施能提供足够的带宽,而且要求网络服务提供者或使用者能清晰地了解网络带宽使用情况,以保证网络应用和管理的科学
随着企业的市场竞争的日趋激烈和业务环境的不断变化,对业务流程管理的要求也变得越来越高,在多流程多实例并行执行的工作流管理系统中,存在各种各样的约束条件和资源竞争,一个多
目前国内外特别是国内,对于工作流技术的研究重点主要集中在对工作流管理系统的体系结构、过程模型,定义工具、系统互联等方面,而对工作流客户端的讨论所见不多。另一方面,当前仅
随着计算机技术和通信技术的迅猛发展,敏感信息通过计算机网络进行交换,特别是电子商务的迅速发展,更多的信息需要严格保密,如,银行账号、个人档案等。密码学的出现,满足了信息的秘
椭圆曲线密码体制是目前公钥体制中每比特密钥安全强度最高的一种密码体制。在相同安全强度条件下,椭圆曲线密码体制具有较短的密钥长度,较少的计算量、存储量和较小的带宽等
尽管工业和学术界在一直努力消除网络拥塞,但它依旧存在并增长。闭环拥赛控制机制已经成为当今网络的标准。在这种机制中,当拥塞发生和快要发生时,网络会向发送源提交一个负
约简和核是粗糙集理论中的重要研究课题,受到广泛关注。现有的约简算法存在着以下一些问题:无法保证结果的完备性;不能保证得到最小约简;空间开销大;时间复杂度高等。 概