SVM<'weight>算法的提出及其在改进分类模型中的应用

来源 :中山大学 | 被引量 : 0次 | 上传用户:qazxc123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘和机器学习的很多算法中都是假定样本的权重相同来训练自己的分类器或产生聚类。而现实中数据的属性不一定都是同样重要的,属性的重要程度往往是要通过对于数据加权来反映的,所以一个好的加权方法在数据挖掘中是很重要的。现在对于数据权重的学习已经成为数据挖掘的一个热点问题。 SVM(Support Vector Machine)是建立在结构风险最小化基础上进行建模的,由SVM的建模思想延伸而产生的结构化SVM(简称SVM)模型被用来学习结构化输出空间,其中要求解的模型参数可以解释为结构权重向量,由SVM衍生的模型经定义相似性度量可以产生加权的聚类模型SVM;本文分析了SVM的不足,提出了改进的权重学习模型SVM。权重学习的效果是要看其能否改进聚类算法或分类算法的效果,因此本文结合SVM和 K-means聚类算法得到加权的聚类算法SVK-means,还结合SVM例与BP分类算法得到SVBP算法;本文通过对若干种分布的人工数据集和8个UCI数据集进行了实验,验证了SVM算法能改进聚类效果,而且比文献[45]中的基本加权的聚类算法WK-means要好,还验证了SVBP算法比不进行加权的BP算法在分类效果上有明显的改进。
其他文献
近年来,入侵检测已成为网络安全领域重要而迫切的课题,面对日益加剧的网络安全威胁,传统的安全技术如认证机制、加密和防火墙等已经难以胜任。入侵检测通常可以分为误用检测和异
本文的主要内容是对中国证券市场上的个股进行随机占优检验,并判断是否存在日期效应。第一章大体介绍了日期效应的概念及前人的研究结果。第二章介绍了随机占优的基本概念。第
随着我国经济社会的全面快速发展,教育事业也得到了全面快速发展.而以多媒体技术、网络技术以及计算机技术为主要内容的信息技术也逐步发展起来,并日益成为了创造性地开发人
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
新mapp组件:设置和控制多达15轴贝加莱进一步扩展了mapp软件模块组合。新的mapp Robo X和mapp Teach让这个组合比之前的机器人系统配置和操作前准备工作变得更快、更简单。ma
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,其主要目标是从大型的数据库中挖掘
本文对通过基因表达数据的统计分析挑选p53调控基因进行了探讨。本研究以在抑制肿瘤过程中有着重要作用的转录因子p53为研究对象,提出了纵向数据分析的统计模型对表达数据进行
局部特征分析(LFA)一种局部子空间方法,它所提取的局部特征点不但有图像的全局的统计意义,同时又着重强调了人脸图像的局部细节,而且它的特征是一种稀疏化的表示,因而它在低维表
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本文对一维带边界零点奇异摄动问题的数值逼近进行了探讨。本研究首先对相应的偏微分方程的解作进一步的分析,利用格林函数得到该方程相关的稳定性。在此基础上对基于离散格林