论文部分内容阅读
现代意义上的垃圾邮件产生于1994年,当时美国人Cantor和Siegel把一封“绿卡抽奖”的广告信发到他们可以发现的每个新闻组,这在当时引起了轩然大波,他们的“邮件炸弹”让许多服务商的服务处于瘫痪状态。十年间,网络和电子信息交换得到了蓬勃发展,而垃圾邮件像爆发的洪水正在侵袭全球互联网。
本文首先介绍了垃圾邮件的定义和危害。然后在简要介绍邮件传输相关协议和邮件结构的基础上,分析了产生垃圾邮件的根源。继而我们对反垃圾邮件的现状和主要技术进行了介绍和分析。详细介绍了两种基于统计学的算法:贝叶斯算法和支持向量机算法,并对它们在邮件过滤中应用的可操作性和实现进行了描述。结合中文反垃圾邮件的需要,我们还对分词词典的设计和中文分词的方法进行了相关的探讨。
根据客户端反垃圾邮件的需要,在参照相关软件的设计方案和功能实现基础上,我们详细分析并设计了这套基于邮件过滤的插件系统。在系统分析和设计过程中,我们使用了面向对象的方法。文中讲解了该系统的整体架构设计,功能模块设计,及所使用的主要算法和技术。特别对贝叶斯与支持向量机技术进行了深入的探讨和研究。
文章最后,我们对这套系统存在的不足之处做了总结,提出了在今后有待完善的之处。同时,我们对邮件过滤的前景进行了展望。