基于朴素贝叶斯和支持向量机的自适应垃圾短信过滤系统

来源 :计算机应用 | 被引量 : 36次 | 上传用户:XUANWU30128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着短信业务的不断发展,垃圾短信的特征和内容也在不断变化,传统垃圾短信过滤系统中存在的主要问题是,短信特征和内容未能得到及时更新而导致过滤性能降低。考虑朴素贝叶斯的快速统计分类及支持向量机(SVM)的增量训练等特点,将其应用于垃圾短信过滤中,并把分析结果及时反馈给在线过滤子系统,使得系统具有更好的自适应性。实验结果表明,该方法可有效地解决当前垃圾短信过滤系统中存在的问题。
其他文献
<正>民间叙事文学是口头性强的文学,它在民众生活作用下,不断创作、传承、变异,由此形成了跨国界、跨地域、跨民族现象,构成了民间叙事文学的生活个性和文化共同性。本栏目的
期刊
对影响邮件特性的邮件报文格式作了仔细的分析并对垃圾邮件的特征进行了分类归纳,在此基础上构建了一个有监督的Bayesian邮件分类网络。通过对该网络作Bayesian参数估计,实现了判定邮件类别的不确定推理。对不同邮件测试集的在线学习试验结果表明,有监督Bayesian邮件分类网络能够有效地实现垃圾邮件的相对完备特征学习,改善邮件过滤的准确率。
分析了传统的VPN系统安全接入实现机制及存在的问题,提出了采用基于“分布式安全代理”技术的一种VPN系统安全接入模式。进而介绍了分布式安全代理的原理及关键安全代理模块。最后,通过并发接入性能对比测试验证了采用分布式安全代理技术对于VPN系统并发安全接入性能提升的作用,说明了该技术在实际应用中的意义。
活动时间:2006年6月15日至7月15日
期刊
为充分应用回转窑计算机看火所产生的火焰图像,提出一种基于内容的回转窑火焰图像的检索方法。分析和提取火焰图像中的纹理特征、颜色特征和形状特征,并进行了归一化。通过计算被检索图像和数据库中图像的特征值的相似度,得到一系列相近检索结果。分别对基于纹理特征、颜色和形状特征及综合特征的检索方法进行火焰图像数据库检索试验。结果表明,这些方法都有较高精度,其中综合特征检索为最高。该研究可为回转窑生产管理和监控提
为了解决多路空间距离连接查询问题,提出了一种基于R树的非增量递归算法。该算法采用深度优先递归搜索策略,同步遍历n个空间数据集对应的R树,算法结束时,同时返回K个距离最短的n元组。并且采用基于距离的平面扫描技术对该算法进行了优化,有效减少磁盘访问次数和CPU响应时间。最后,通过实验验证了算法的有效性。
针对数据流上连续查询处理的特征,为适应流数据特征以及执行环境的易变因素,该文从选择率和执行时间的角度出发,考虑内存使用量和输出延迟适应性因素,提出一种适应性的查询处理策略—HoliAdapt。该策略基于查询窗口动态地收集统计信息,利用数学方法不断地优化查询计划,通过核心调度方法,对操作符进行适应性的调度。实验证明该策略有效地减少时间延迟和内存使用量,最终提高系统查询的效率。
为了减少运动估计的计算复杂度并提高其搜索性能,提出了一种基于低频子图的运动估计算法。该算法首先将当前帧和参考帧通过低通滤波器得到数据量减为1/4的低频子图,然后用全搜索得到最佳匹配的低频子块,最后对低频子块所覆盖的原参考帧区域进行精细搜索得到最优点。实验结果表明,与传统运动估计算法相比,该算法提高了运动估计的精确度和降低了计算复杂度,并且对各类视频都有很高的鲁棒性。
提出一种全色遥感图像中城区的快速模糊分割算法。该算法基于模糊集理论,根据贝叶斯准则建立相应的隶属函数,并分析选取城区在全色图像中有效的特征,逐步实现城区的分割。实验以SPOT-5全色图像为例,并对模糊训练的可靠性进行分析,最后与区域增长法和多尺度几何信息分割算法进行比较。实验表明,该算法简单准确快速,能够为一些重要的应用提供有效支持。