论文部分内容阅读
近年来,我国的因特网应用进入大发展阶段,电子邮件给用户带来很大方便的同时,也产生了一个新的问题,即大量的垃圾邮件的出现。如何将无用的垃圾电子邮件过滤掉,已成为电子邮件用户关心的一个大问题。这就是所谓的“反垃圾邮件”问题。因此,有效的防治垃圾邮件已经成为了一个有着现实意义的研究课题。目前绿色网络空间的建设需要从立法、组织和技术等多个方面共同努力,综合治理方能彻底解决垃圾邮件的影响和危害。
本文从治理垃圾邮件的技术层面出发,在大量研究了目前的各种反垃圾邮件技术的基础上,着重选取了基于规则的黑白名单与关键字过滤技术与基于统计方法的贝叶斯过滤算法作为论文工作的重点内容。本文利用三种技术的优点,相互弥补了自身的不足,设计和实现了一套综合邮件过滤系统。本系统在收发邮件的基本功能之上,实现了用户的个性化垃圾邮件过滤设置。用户可以根据自己的意愿,将一些不愿意接收到的邮件地址添加到黑名单中,将一些信任的邮件地址添加到白名单中,用户还可以按自己的意愿对邮件主题中的关键字进行过滤。邮件系统的后台则实现了贝叶斯过滤算法,实现了精确而智能的过滤。整个系统由邮件解析模块,邮件预处理模块,贝叶斯学习模块和贝叶斯判定等模块构成。最后对该系统行了测试,结果表明该邮件过滤系统过滤精度较高,且随着测试样本数据的适当增加,系统的性能指标呈持续提高。