贝叶斯数据挖掘技术及其在反垃圾邮件中的应用

来源 :广西大学 | 被引量 : 0次 | 上传用户:ralphth
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的迅猛发展,电子邮件正成为一种最快捷、最经济的通信手段。但电子邮件在成为一种信息交流工具的同时,也正在成为一种商业广告手段。在收到有用信息的同时,用户也从因特网上收到各种各样广告邮件,用户要花费大量时间来处理这些所谓的“垃圾”邮件。如何对邮件进行处理,将有用邮件保留而过滤掉垃圾邮件是用户关心的一大问题,这就是所谓的“反垃圾邮件”。虽然目前某些系统已采用一些技术进行反垃圾邮件,但这些技术都存在一定的不足。因此,研究一种有效的反垃圾邮件系统具有十分重要的意义。 在数据挖掘技术中,分类技术是一种重要的技术,它对大量有关数据进行分析、学习、并建立相应问题领域的分类模型,从而对未来数据进行预测。分类的方法有决策树、神经网络和贝叶斯分类等。贝叶斯分类起源于统计学,它具有方法简单、运算速度快、分类精度高等优点,因而被广泛应用在文本分类摘要领域。 本文在贝叶斯分类器的工作原理的基础上,提出了基于贝叶斯分类器的反垃圾邮件模型的设计与实现方法,并提出了用遗传算法对模型进行优化的算法,同时,对基于贝叶斯分类器的反垃圾邮件模型的闭值问题进行研究,实验结果表明这些算法具有较好的性能。
其他文献
随着高性能计算技术的飞速发展,并行计算已经成为提高计算机系统性能的主要方法,并行计算的可扩放性也成为评价并行计算性能的主要指标之一。但随着高性能计算机系统规模的不
近年来,伴随盲信号分离问题产生的独立分量分析(Independent Com-ponent Analysis,简称为ICA)理论己逐渐成为统计信号处理中的一个研究热点,并正迅速成为多维数据分析的一个
随着电子设计技术的快速发展、高性能芯片的不断涌现、芯片性能价格比的提高、实际应用的迫切需求,嵌入式开发技术的研究已经成为了可能,并且已经具有广泛的应用前景和发展潜
本文提出了一种面向防汛虚拟会商过程的模型-NI动态模型,并给出了模型在防汛会商活动中的应用分析,提出了三种专家判断矩阵一致性调整的新方法。 本文提出了一个新的基于决
推荐系统被认为是大数据时代最有效的个性化技术,其目标是为用户推送最有价值的信息,提高用户获取信息的效率。对于推荐系统的研究,既有重要的社会意义,又有重要的经济价值。自上
网格又被称为下一代的Internet,它代表了面向Internet的分布计算技术的新趋势。随着网格技术的使用广泛和深入,如何提供一个网格程序的开发、调试的集成丌发环境,已经成为一
随着互联网的发展,当前出现的Web标准如WSDL,SOAP,UDDI,DAML-S,使得Internet成为一个异构的、具有互操作性的Web服务的海洋,从而使应用程序的开发过程简化为发现Web服务和集成Web服
随着无线通信技术的发展,移动银行、移动证券、移动办公等无线增值应用业务相继出现。无线增值应用在给我们的生活带来极大方便的同时,也带来了很多的安全隐患。与有线环境下
当今,随着互联网技术和通信技术的高速发展,网络中数据信息量呈现爆炸式增长,用户对数据信息存储的性能和可靠性提出了更高的要求。网络中数据业务的增加使得传统单节点数据
随着Internet技术的发展以及音视频压缩技术的进步,基于Internet的多媒体交互平台受到了越来越广泛的重视。本文以构建一个实用的交互式多媒体实时教学系统为目标,对其中若干