基于贝叶斯过滤算法的反垃圾邮件技术研究及其实现

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:hedayang82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,Internet上垃圾邮件问题日益严重。其治理和解决需要从立法、组织和技术三个方面综合共同努力,彻底解决垃圾邮件的影响和危害。作者从治理垃圾邮件的技术层面出发,在大量研究了目前的各种反垃圾邮件技术的基础上,着重选取了一种基于贝叶斯过滤算法的反垃圾邮件方法作为论文工作的重点内容,收集了大量的邮件样本,利用该算法对其进行细致而深入的研究,并以此为核心用VC++实现了一个桌面应用,即反垃圾邮件代理产品:AntiSpam。它采用代理的原理,工作在邮件服务器和邮件客户端之间,可以有效的过滤和分离用户的垃圾邮件。该系统充分考虑用户的个性化要求,具备较好的自适应性。AntiSpam通过从用户现有的邮件样本集合提取和分析垃圾邮件的特点来识别和过滤新到邮件,同时支持中英文两种语言的邮件处理。AntiSpam是一种治理垃圾邮件的客户端解决方案。系统主要包括邮件代理、邮件解析、邮件过滤、中文分词、参数配置、日志分析等模块。本文作者的主要工作是基于贝叶斯过滤算法的研究并给出该算法的一个C++实现,以及在此基础上的对算法中相关特性参数选取的部分改进。邮件过滤模块主要采用了该算法来识别垃圾邮件。邮件代理模块采用Winsock通讯方式,利用代理服务器的工作原理,实现了对邮件的接收和过滤,同时较好的完成了与现有的邮件客户端软件的整合。这两部分也是本系统的关键。
其他文献
作为分布环境中网络异构问题的解决方案,中间件备受关注。中间件开发中一个重要的问题就是网络通讯服务的设计与开发——任何一种中间件都必须依赖通讯服务来完成其自身各部
本文对基于离散元法的精密排种器分析设计软件开发进行了研究。文章在对国内外该方面的研究现状及存在问题进行分析的基础上,提出了由CAD模型建立其离散元法分析模型的方法,并
本文围绕邻接特征的选择、表示和使用进行相关研究,提出了基于邻接特征的网页主题传播算法。该算法基于网页超链接构建的有向图模型,针对网页的主题局部性特点,实现了邻接网
射频识别技术(RFID)被广泛应用于工业自动化、商业自动化、交通运输控制管理等众多领域,具有广阔的市场前景。  本文首先介绍了RFID技术的基本原理及其相关理论;然后重点分