反向选择结合支持向量机的垃圾邮件检测模型

来源 :武汉大学 | 被引量 : 0次 | 上传用户:fl908720
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾邮件逐渐成为不法分子攻击欺诈用户的主要媒介,而现有垃圾邮件内容形式多变、伪装手段层出不穷,为了保障用户正常使用邮件,垃圾邮件的检测刻不容缓。垃圾邮件检测技术分为两类:第一,以黑白名单为代表的基于知识工程的方法,它们根据不法来源名单来鉴别垃圾邮件,对未知来源的垃圾邮件存在较高的漏报率。第二,以支持向量机等方法为代表的机器学习方法,它们根据正常邮件和垃圾邮件的不同特征通过样本训练建模,模型的分类效果完全依赖于训练集,而人工获取训练集的方式为这种检测带来了较大的不确定性,模型也无法自适应更新。受计算机免疫系统的启发,根据免疫体系中的反向选择算法-它能根据有限的自我判别非我、自适应强的特性,本文提出将支持向量机和反向选择算法结合,构建一个具有动态反馈自适应的垃圾邮件模型。通过反向选择算法将检测出漏报的新型垃圾邮件动态补充训练集重新生成检测器,来解决人工选取的不确定性问题,让垃圾邮件的训练和检测成为一个动态平衡的自适应过程。本文具体研究内容如下:1)对垃圾邮件的现状进行描述,阐述了垃圾邮件的危害、发展以及现有垃圾邮件在形式内容、伪装手段上的动态多变性特征,通过归纳现有垃圾邮件检测技术和解决方案,总结出垃圾邮件检测过程中无自适应性、训练集的选取存在人工干扰的问题;2)提出一个反向选择结合支持向量机的模型用于垃圾邮件检测。该模型包括邮件预处理、检测器生成、模型检测、反馈更新SVM分类器四大部分,不仅能利用反向选择生成的成熟检测器自适应检测未知的新型垃圾邮件,还能根据检测器识别出的新型垃圾邮件动态补充更新训练集,无需人工干预就能生成新的SVM分类器。3)借助公有数据集Enron Email Dataset构建一个垃圾邮件检测实验系统,本文设计两组实验来验证本文设计的SVM-NSA垃圾邮件检测模型的实际分类效果,并与单一的算法模型作横向比较。实验结果证明该模型在不影响正常邮件的识别率的前提下,能检测出更多的垃圾邮件。
其他文献
基于硫酸根自由基(Sulfate radical,SO4-·)的高级氧化技术(SR-AOPs)是近年来快速发展的新兴高级氧化技术(advanced oxidation technology,AOPs),通过一定的活化方式(热、光辐射、超
研究目的:DDIT3在内质网应激反应中至关重要,能促进细胞凋亡,也与许多炎症和矿化发生发展过程密切相关。牙骨质在保护牙齿免受牙周炎伤害的同时,也为牙周组织中的sharpey纤维
随着计算机技术、通信技术、自动化技术的发展,移动机器人的应用范围也越加广泛,机器人技术也因此引起了广大研究者的关注。相比单个机器人而言,多机器人协作可以完成更为复
自中共十九大以来水环境安全备受人民群众关注,广大研究者也逐渐在水体污染防治方面展开广泛研究。我国水污染治理已经处于瓶颈时期,主要原因归咎于缺乏有效的水处理技术,导
创新发展逐渐成为新时代下引领我国社会经济发展的新引擎,在此大背景下,本文以杭州九乔创新空间为例,并尝试归纳出城市创新空间的规划设计框架,为众多创新城市空间发展提供一
脉冲超宽带波束成形技术适用于高分辨率和精确定位的场景中,比如MIMO天线阵列系统。在短距离无线通信领域,如无线传感网和无线体域网中也有广泛的应用。基于实时延时技术的组
在线旅游住宿平台在为游客带来便利的同时也加剧了信息过载的问题,推荐系统因此被广泛应用并旨在为游客提供个性化的决策支持和提高其交易效率,也有助于在线旅游运营商树立自身竞争力。共享住宿近年来成为了在线住宿的一大热点,一方面,共享住宿吸引当地居民出租闲置房屋给有住宿需求的房客,另一方面,平台引入了双向选择和双向评价机制来缓释交易风险,共享住宿因此衍生了区别于传统在线住宿的两个特点:房客在选择房间时考虑房
钢铁企业转炉生产过程中会产生大量的烟尘,为了避免环境污染,很多钢厂采用转炉干法除尘系统进行除尘,干法除尘系统具有除尘效率高、能耗低、运行成本低、占地少、烟尘易回收
在航空航天、战斗机驾驶等情形中,宇航员、飞行员最高需要承受8-9G的重力。超重力带来的惯性力对人体的器官、组织、体液等有不同程度的影响。纵向超重力会引起脑部供血不足,
通过网络拓扑结构可以设计并评估新的网络协议和服务,使得获取Internet的网络拓扑结构对网络研究变得非常重要。Internet网络拓扑存在异构性、多样性、动态性等特性,使得获取