论文部分内容阅读
随着Internet的不断发展,互联网给人民的生活带来了越来越多的便利,许多服务已经成为人们日常必不可少的组成部分。但随之而来的是网络安全环境的日益恶化,人们在享受网络带来的便利的同时,也承受着网络带来的烦扰。电子邮件正是这一现象的典型的例证,无法想象在现代社会中没有电子邮件会变成什么样,但日益严峻的垃圾邮件问题也得到了越来越多的关注。有统计显示电子邮件用户平均每天收到的垃圾邮件数量已超过了正常邮件,更可怖的是当前的垃圾邮件有渐渐和网络攻击结合的趋势,几乎所有的网络攻击技术都可以在垃圾邮件中找到其踪影。
从目前的反垃圾邮件技术来看,侧重点主要有两个,一是在邮件发送的时候进行识别,如早期的黑白名单技术,规则过滤以及对发送者行为规律进行统计而形成的行为识别技术;二是模拟人工分辨垃圾邮件的方法,对邮件内容进行计算机智能分析,以期达到识别垃圾邮件的目的。这两类反垃圾邮件技术在现实生活中都有成功应用的案例,但也有其各自的缺陷。
本文在对这两类技术深入分析的基础上,找到一种将两类技术融合到一起的方法,使之取长补短,达到更准确、更有效的过滤垃圾邮件效果。
具体的说,本文的工作主要包含下列内容:第一章是绪论,给出了垃圾邮件的定义、危害及其解决之道;第二章回顾垃圾邮件过滤技术的历史及当前常用的过滤技术;第三章深入分析邮件的发送模式,构建垃圾邮件行为识别模型;第四章分析了基于统计学的算法在垃圾邮件内容识别中的应用,构建垃圾邮件内容识别模型;第五章融合两种模型,建立二维垃圾邮件识别模型。