基于用户关系行为的垃圾邮件判别机制的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:jzhiei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为互联网最基础的应用之一,电子邮件的广泛使用使其占据互联网数据总量的三分之一左右。随着应用的增多,垃圾邮件数量的增长也非常迅速,网民每周收到的垃圾邮件占总邮件量的三分之二还多。近几年来,为应对垃圾邮件愈禁愈多的情况,众多研究人员提出了多种有效判别垃圾邮件的解决方案,但随着实际情况的变化,垃圾邮件发送形式和方法不断演进,各类技术总是无法长期发挥作用。本文总结了现有垃圾邮件判别技术,重点分析了邮件用户关系行为,在现有基于行为解析的垃圾邮件判别技术的基础上,归纳出邮件用户关系行为网络社区概念。根据邮件用户之间的关系,建立邮件用户关系行为网络,利用复杂网络社区划分算法划分用户关系社区,然后把这些用户关系社区应用于实际的垃圾邮件判别。本文在研究现有行为识别技术的过程中,把邮件通信行为网络看成是人际关系网络范畴,该判别机制的关键在于用户关系网络的社区划分。为此,引入快速Newman算法(简称FN算法)、CPM (Clique Percolation Method)算法和基于节点联系算法,建立对比社区划分机制,以获得最优划分。将建立的用户关系社区划分机制的具体模型应用到反垃圾邮件领域中,提高了垃圾邮件的识别精度和处理速度。为了提升判别机制的准确度,对通过用户关系行为社区识别出的可疑邮件采取进一步的判别,引入了分类回归树算法(CART),根据前期邮件头数据处理获得邮件行为特征数据,对照正常邮件行为进行多重判别。经过系统实现验证,结合测试数据的反馈结果证明,基于用户关系行为的垃圾邮件判别机制的设计是合理有效的,不仅减轻了邮件服务器的过滤负载,而且具有较高的准确率和很好的召回率。
其他文献
科学技术是把双刃剑,在人们体味、享受它给生产及生活带来巨大好处的同时,也为造伪者提供了便利和手段。其中,伪造票据的违法犯罪活动就给国家带来了巨大的经济损失。因此,加强对
无线传感器网络在军事国防、环境监测、抢险救灾和危险区域的远程控制等诸多领域具有广泛的应用前景。网络节点或监测目标的定位是其中众多应用的一个关键条件。而且无线传感
网格是从电力网格中借鉴过来的一个概念,它是构筑在互联网上的一组新兴技术。网格计算系统及其应用的目的在于对位置分布、异构和动态变化的虚拟机构的资源和服务进行集成与管
图像匹配是计算机视觉中的一个基本问题,在诸如三维重建、对象识别和分类等应用中,图像的匹配都是一个关键的步骤。本文主要研究了轮廓图像的特征提取和匹配技术。 在图像特
随着各个学校对信息技术教育的日益重视,现代化的校园网络建设也已成为了热点。目前,大多数的学校已经拥有了自己的校园网,但通常是仅具备较完善的硬件网络环境,而在各种应用软件
制造执行系统(Manufacturing Execution System,MES)是一种面向车间级的管理信息系统,在企业生产管理中发挥着承上启下的作用,为车间管理提供生产计划的执行、跟踪以及各种资源运行状态等信息,是制造业信息化新的发展趋势。 本文运用基于组件的开发技术对面向多品种、小批量生产环境下的可重构装配制造执行系统进行研究,并就相关的问题提出了一些新模型。主要研究内容包括:
工作流管理技术是实现企业业务过程建模、业务过程仿真、业务过程优化、业务过程管理与集成,从而最终实现业务过程自动化的核心技术之一。传统的C/S模式下的集中式工作流管理
图像能非常直观的表现生活。随着计算机技术的迅速发展,多媒体技术、模式识别和计算机视觉等技术都需要运用图像前景提取。运用计算机进行图像前景提取的研究也越来越重要。
安全是现代航空工业尤其是民航运输工业的首要要求,发动机的健康状况将直接影响飞行的安全性。机械故障往往会导致重大的飞行事故,而磨损类故障又占有相当的比例。滑油中的磨屑
随着市场竞争的日趋激烈,信息对于企业的生存和发展起着越来越重要的作用,同时也要求高层管理者做出迅速而明智的决策。90年代中期出现了三项支持决策新技术:数据仓库、联机分析