论文部分内容阅读
近年来,Internet上垃圾邮件问题日益严重。其治理和解决需要从立法、组织和技术三个方面综合共同努力,彻底解决垃圾邮件的影响和危害。作者从治理垃圾邮件的技术层面出发,在大量研究了目前的各种反垃圾邮件技术的基础上,着重选取了一种基于贝叶斯过滤算法的反垃圾邮件方法作为论文工作的重点内容,收集了大量的邮件样本,利用该算法对其进行细致而深入的研究,并以此为核心用VC++实现了一个桌面应用,即反垃圾邮件代理产品:AntiSpam。它采用代理的原理,工作在邮件服务器和邮件客户端之间,可以有效的过滤和分离用户的垃圾邮件。该系统充分考虑用户的个性化要求,具备较好的自适应性。AntiSpam通过从用户现有的邮件样本集合提取和分析垃圾邮件的特点来识别和过滤新到邮件,同时支持中英文两种语言的邮件处理。AntiSpam是一种治理垃圾邮件的客户端解决方案。系统主要包括邮件代理、邮件解析、邮件过滤、中文分词、参数配置、日志分析等模块。本文作者的主要工作是基于贝叶斯过滤算法的研究并给出该算法的一个C++实现,以及在此基础上的对算法中相关特性参数选取的部分改进。邮件过滤模块主要采用了该算法来识别垃圾邮件。邮件代理模块采用Winsock通讯方式,利用代理服务器的工作原理,实现了对邮件的接收和过滤,同时较好的完成了与现有的邮件客户端软件的整合。这两部分也是本系统的关键。