MAIL系统中垃圾邮件的过滤算法研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:fcunui_w
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国的因特网应用进入大发展阶段,电子邮件给用户带来很大方便的同时,也产生了一个新的问题,即大量的垃圾邮件的出现。如何将无用的垃圾电子邮件过滤掉,已成为电子邮件用户关心的一个大问题。这就是所谓的“反垃圾邮件”问题。因此,有效的防治垃圾邮件已经成为了一个有着现实意义的研究课题。目前绿色网络空间的建设需要从立法、组织和技术等多个方面共同努力,综合治理方能彻底解决垃圾邮件的影响和危害。 本文从治理垃圾邮件的技术层面出发,在大量研究了目前的各种反垃圾邮件技术的基础上,着重选取了基于规则的黑白名单与关键字过滤技术与基于统计方法的贝叶斯过滤算法作为论文工作的重点内容。本文利用三种技术的优点,相互弥补了自身的不足,设计和实现了一套综合邮件过滤系统。本系统在收发邮件的基本功能之上,实现了用户的个性化垃圾邮件过滤设置。用户可以根据自己的意愿,将一些不愿意接收到的邮件地址添加到黑名单中,将一些信任的邮件地址添加到白名单中,用户还可以按自己的意愿对邮件主题中的关键字进行过滤。邮件系统的后台则实现了贝叶斯过滤算法,实现了精确而智能的过滤。整个系统由邮件解析模块,邮件预处理模块,贝叶斯学习模块和贝叶斯判定等模块构成。最后对该系统行了测试,结果表明该邮件过滤系统过滤精度较高,且随着测试样本数据的适当增加,系统的性能指标呈持续提高。
其他文献
本文采用知识驱动型目标识别策略。结合前人的理论成果,分别研究和实现了基于形状特征和边缘特征的两种对水上桥梁识别方法,以及一种基于直线模型的机场识别方法。 基于形状
随着大规模处理器系统的快速发展,处理器的故障诊断已经成为系统可靠性研究中的一个重要问题。优良的网络模型应具备良好的诊断性,使其可以更好地诊断出系统中的错误处理器从
随着网络与CAD技术的迅速发展和不断广泛应用,产品数据安全已经成为一个新的研究领域,而协同环境中共享CAD模型的数据安全对于产品的开发和全生命周期管理显得尤其重要。其中
数据挖掘是指在数据中发现模式、知识或数据间的关系。分类挖掘是数据挖掘中最活跃、最成熟的研究方向,分类算法又是其中涉及到的关键技术。在各种分类算法中,决策树方法有更
随着软件规模和软件复杂度的不断扩大,软件生产效率低、系统可移植性差、互操作性差以及文档维护更新困难等问题逐渐突显出来。在这样的背景下,对象管理组织OMG (Object Mana
近年来,压缩感知(Compressive Sensing, CS)理论的提出突破了传统的信号采样定理,能够以远小于奈奎斯特采样速率进行信号的获取,并实现对信号的完美重构。由于CS理论将采样和
学位
随着计算机网络的迅速发展及广泛应用,网络安全技术己经成为计算机技术中一个重要的研究领域。在众多的网络安全技术中,入侵检测系统以其快速的检测方法成为防火墙技术的一个
本文研究了医学图像归档与传输系统(PACS)中广泛使用的DICOM(Digital Imagingand Communication in Medicine)标准,并在此基础上介绍了基于DICOM标准的医学影像处理工具的设
环签名、代理环签名作为特殊的数字签名技术,由于它们的特殊功能性,被广泛应用在匿名电子投票、匿名选举等一系列特殊应用场合。对这样的特殊数字签名方案进行深入研究具有很