支持向量机在大规模数据中的应用研究

被引量 : 0次 | 上传用户:simon_01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine, SVM)是当今机器学习中解决分类问题的重要方法之一。基于统计学习理论、最优化算法和核方法的支持向量机具有全局优化、泛化能力强、避免“维数灾难”等优点。目前已成功应用于人脸识别、生物信息、故障诊断、网络安全、文本分类等领域中。支持向量机的优势在于小样本、高维数据的模式识别,面对现今普遍的海量数据,由于占用内存大、训练时间长等缺陷,还有待完善与拓展。本文立足于SVM的理论基础、分析了其几何特点,对在大规模数据中的应用进行了初步的研究。论文通过分析分类超曲面关于支持向量(Support Vectors, SVs)的几何位置结构,提出了分步训练的策略。首先用网格的形式将样本较多的原始数据聚类为较少的数据,同时根据数据分布情况选择核函数及参数,对归类后的数据使用SVM训练得到潜在的支持向量和初步的决策函数,进一步对以上结果再次训练,从而得出最终的决策函数。对于初步训练得出的潜在支持向量或原数据集的标称属性(Nominal Attribute)较多的情况,提出了分段处理的思想,综合局部训练得到的结果给出最终的决策函数。最后通过常用的测试数据,将本文的策略与原有SVM算法在训练速度、准确度和泛化能力方面进行比较,验证了其学习速度和有效性。
其他文献
目前,我国公交公司主要依靠经验丰富的工作人员估计车辆回场时间,进而进行车辆调度,此方式缺乏辅助的预测方法,常常造成较大的误差与错误的调度决策。从公交公司的实际需求出
针对光纤电流互感器在电力应用中的长期可靠性问题,分析了其光学组件常见的失效模式,阐述了变比误差等关键指标退化的规律。并引入peck加速模型,以温度、湿度为应力因子,开展
校本培训作为一种集实践性、问题性、探究性与综合性为一体的培训方式,在引领教师更新教育理念,提高新课程实施的水平,提升教育教学质量等方面发挥着重要的作用。
<正>近几年,我门在对工会经费的会议费支出审计中发现,其违规使用主要有以下三种情况:一、虚支虚列会议费部分单位在账务处理过程中,为使"三公"经费账面支出数和年终决算数在
在煤矿事故中人因事故占80%以上。滨湖煤矿结合员工人员构成复杂及文化水平、思想道德素质和业务技术素质参差不齐的客观实际,基于“木桶理论”短板原理,创新性地提出了安全
研究了不同浓度吲哚丁酸(IBA)对长白落叶松种子萌发的影响,结果表明,处理过的种子发芽率明显提高,主要表现在伴随着浓度的提高,发芽率、发芽势和发芽指数均有所提高,但是当浓
移动计算是计算技术与无线通信技术的融合,其核心目标在于屏蔽无线通信和移动环境,平滑实现资源访问和资源共享。当前,移动计算领域存在大量亟待解决的基础性问题,如弱连接问题、
针对精囊炎不育症的论治要点,从中医治疗指征、辨证思考、探讨病因病机、辨证用药以及针灸、穴位注射治疗等方面提出决策,为男科不育证的中医辨病辨证实践提供借鉴。
利用二维合成孔径并发射宽带信号,可以实现目标的距离-方位-方位三维成像,提出一种基于三维匹配滤波的高适应性三维成像算法。先选定成像焦点的位置,再根据场景参数计算出在
中西语言与文化的差异会导致文学作品翻译的损失。本文将从莫言小说《生死疲劳》的英译本中撷取译例,从语言学和文化层面探讨汉英翻译中的损失及补偿策略,将翻译补偿理论应用