基于内容的图像垃圾邮件过滤技术研究

来源 :兰州理工大学 | 被引量 : 3次 | 上传用户:jekiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于邮件内容,并结合机器学习理论、文本分类和信息过滤技术的垃圾邮件过滤器得到了广泛的应用,但这些方法都有一定的局限性。由于这类过滤器对图像格式的垃圾邮件无能为力,因此,随着图像垃圾邮件数量的日益增长,如何识别和过滤图像垃圾邮件成为IT界及邮件服务提供商迫切需要解决的问题。本文分析了垃圾邮件过滤问题的研究现状,主要包括垃圾邮件的定义、危害及当前主流的垃圾邮件过滤技术及其优缺点等;论述了垃圾邮件图像过滤中的关键问题——图像特征提取,系统地讨论了颜色、纹理、形状等多种图像视觉特征及提取方法。针对图像垃圾邮件的新特性,本文在分析垃圾邮件发送行为及邮件内容的基础上,利用垃圾邮件大批量、反复发送及内容高度相似的特点,提出一种基于图像相似性检测的垃圾邮件图像过滤方法。本方法通过检测邮件图像与垃圾邮件图像样本的相似度来实现:提取邮件图像的颜色、纹理、形状等底层视觉特征,基于综合特征比较新邮件图像与垃圾邮件图像样本的相似度,以此判断该邮件图像是否为垃圾邮件图像。并对方法中涉及的相关问题及关键技术进行了论述,包括图像相似性度量及特征归一化处理等。实验结果表明,基于图像相似性检测的垃圾邮件图像过滤方法对垃圾邮件图像有很好的过滤效果。本文的研究为过滤图像垃圾邮件提供了有益的探索,也为设计出更好的反垃圾邮件方案提供了理论支持,具有相当的理论意义和实际应用价值。
其他文献
伴随着计算机网络技术的高速发展,人类社会的高度信息化已成为一种趋势,网络中的安全问题也逐渐的凸显出来,这引起人们极大的关注。入侵检测作为计算机安全领域中一个重要组
智能网(IN,Intelligent Network)是在原有通信网的基础上,为了快速方便提供新业务而设置的一个叠加网络。CAMEL(Customized Application for MobileNetwork Enhanced Logic)
随着基于构件软件开发技术的迅猛发展,构件库变得越来越复杂,对构件的学习和检索提出了更高的要求。序列模式发现是在给定时间窗口内的序列集中挖掘所有最长频繁序列的过程。
随着数字技术和因特网的发展,网络安全问题日益突出,计算机网络的主要特点是开放性与资源共享,而由此引发的问题也十分严重,如作品侵权、复制、篡改、传播变得更加方便。数字水印
随着计算机科学技术的发展、Internet的应用普及以及多媒体数据库的迅速增加,我们拥有了海量的数字图像和视频信息。为了有效的管理和检索这些信息,基于内容的图像检索(Conte
近年来,随着网络技术的迅速发展和J2EE平台的广泛采用,基于B/S的多层Web体系结构逐渐发展成熟起来。MVC(Model-View-Controller)设计模式能够克服传统Web应用开发方式所固有
在道路交通管理中,为了获得车辆的运动数据,早期经常采用的是感应线圈等硬件测量的方法。而如果采用摄像头拍摄的道路视频,再用计算机软件处理的方法,则可以极大的增加方便性
软件的不断发展,给后续的开发带来了困难,并且对软件可维护性提出了挑战。运用软件工程的手段和设计模式的方法可以缓解这些问题。设计模式作为面向对象软件设计经验的总结,
虚拟器官的建模与仿真是当前国际上研究的前沿课题。眼睛作为人体中一个极为精密且十分重要的器官,其建模与仿真的实现具有十分重要的意义。角膜是人眼的重要组成部分,角膜的
近年来,随着internet的飞速发展,电子商务网站的增多,积累了大量的web日志数据,如何从这些海量的日志文件里找到用户访问站点的行为习惯和兴趣爱好,已成为了web日志挖掘的研