基于MapReduce的SVM改进算法及在邮件过滤中的实现

来源 :无线通信技术 | 被引量 : 0次 | 上传用户:xiaomay2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对海量文本邮件的挖掘过滤需要更大的存储空间、以及更强的计算能力,提出一种基于Hadoop云计算平台的垃圾邮件过滤方法。其思想:把相对孤立的数据集合并成易于云平台处理的大文件集合;依据评估函数构建文本向量,将邮件转换为结构化的描述;基于MapReduce分布式编程模型改进SVM算法,利用集群整体的计算能力求解最优平面。实验表明:该方法能利用廉价的计算机集群代替昂贵的高性能机器实现海量邮件数据的挖掘过滤;并且,分类效率能随着集群规模的扩增而提升较快。
其他文献
目的:观察口服妥塞敏联合微针治疗黄褐斑的临床效果及安全性。方法:将120例黄褐斑患者随机分为治疗组与对照组。治疗组:60例,给予口服妥塞敏联合微针治疗;对照组:60例,给予口
目的:探讨电子线放射联合局部注射5-氟尿嘧啶和曲安奈德治疗瘢痕疙瘩的疗效。方法:选取瘢痕疙瘩患者41例,病灶51处,平均病史4.5年,平均治疗时间为6个月。根据是否使用电子线
本文重点阐释博物馆陈列空间的审美塑造引发作为审美主体的观众的相应情感,开反作用于博物馆的发展和建设,成为博物馆或展览成功的重要因素。
本文提出了基于工作过程的高职《PLC原理及应用》课程知识体系构建思路和策略,以典型工作任务分析为基础进行课程建设和教学改革,将"工作过程的学习"与"课堂上的学习"融为一
综合介绍了线性逐步回归算法、偏最小二乘回归算法、人工神经网络算法、支持向量机回归算法在农作物信息遥感预测建模中的应用,阐述了这些算法的基本思想,给出了每种算法的求解
相位噪声也能引起信道间干扰( ICI) ,本文系统的分析了采用ICI自消除方案前后相位噪声对OFDM系统的影响,得出了载波干扰比和信噪比的近似计算公式,在AWGN信道上仿真了系统的
介绍了形式化方法和形式化规格说明语言Z语言,利用Z语言对软件需求进行了严格定义,在严格的数学基础上进行软件开发,以获得更好的软件性能.利用形式化方法的需求分析,有助于发现需
个人独资企业与个体工商户在市场经济的今天并无实质区别。应该建立个体工商户向个人独资企业的"转板制度",明确各自制度优势,实现商个人体系的层次发展。
目的调查重大车祸伤存活患者创伤后成长与心理症状的关系。方法采用创伤后成长评定量表和症状自评量表对88例车祸伤后存活患者进行调查。结果车祸伤患者创伤后成长总分为(85.73
随着社会经济的迅速发展,建筑工程项目逐渐变得越来越多,而房屋建筑施工也正在如火如荼的进行着。对于房屋建筑施工而言,防渗漏施工技术是其中不可缺少的一部分。防渗漏施工