基于PSO的负选择算法及其在垃圾邮件过滤中的应用

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:zhuzi1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网成为人们必不可缺的生活方式的今天,电子邮件是最为快捷、经济的互联网应用之一。同时电子邮件也逐渐成为包括移动通讯在内的,人们主要的信息交互方式之一。但是,垃圾邮件的泛滥不仅严重阻塞了电子邮件这条全球最经济最便捷的交流通路影响,而且影响国内的邮件服务商在全球的形象,以及中国信息产业的长远发展。   在研究中发现,垃圾邮件过滤所遇到的问题和人工免疫系统所遇到的问题有惊人的相似性。因此,包括垃圾邮件过滤在内的计算机安全领域中出现的问题可以使用免疫系统中抽象的计算模型来解决,所以,人工免疫系统也越来越多的应用到计算机安全领域的研究中。   首次提出了负选择算法的是Forrest,该算法基于免疫系统中自我(self)和非我(non-self)区分的原则,算法的实质是一个二进制空间中的二分类问题。为了提高检测器的性能,在负选择的基础上改进检测器匹配算法和生成算法,同时引入自适应遗传算法和粒子群优化算法(PSO)对负选择算法中的关键参数进行优化,而产生了基于免疫优化算法的海明型空间负选择算法(PGHSNSA)。   PGHSNSA应用了自适应的遗传算法动态的改变检测器个体的变异概率和交叉概率,主要目的是在进化初期这种交叉概率和变异概率的调节方式有较强的全局搜索能力和较弱的局部搜索能力,同时,随着进化的深入,全局搜索能力逐渐减弱,局部搜索能力逐渐增强。自适应的遗传算法可以使在检测器数量一定的情况下,检测器个体能够尽可能的覆盖非我集合空间。海明型空间的引入,使检测器在生成过程中通过海明置换能有效的避免或者减少“空洞”的产生,同时通过r块匹配规则使生产的检测器能更好的覆盖非我集合空间。对于应用在垃圾邮件过滤中的PGHSNSA,最重要的两个参数是检测器的维数和检测器的个数,本文基于PSO对这两个参数进行优化,提出了融合PSO和负选择的优化算法,PGHSNSA算法能在尽可能少的检测器维数和检测器个数的情况下,达到尽可能好的垃圾邮件过滤性能。
其他文献
天网FTP资源搜索引擎是对中国部分IP集合进行扫描,获取其中匿名FTP站点文件信息来为广大互联网用户提供资源搜索服务的垂直搜索引擎。随着中国IP集合以及引擎扫描集合变大,旧
无线射频识别(RFID)技术的应用越来越广泛,目前已成为国内外研究的热点。但目前绝大多数RFID应用仅限于企业内部的闭环应用,尚未走向跨地区、跨行业乃至全社会的规模化应用。其关
学位
随着经济的发展,我国的社会化进程加快,各方面都取得了快速的发展和提高,这就产生了一个需求,即如何更好的适应和指导这些发展变化。而这些都离不开对宏观经济走势的把握,无论是对
学位
禽流感的每次爆发都会对全球的经济产生巨大的冲击,而野生鸟类是禽流感感染的主要群体,是疫情传播的主要源头之一。当前对禽流感的预防和控制一直是一个巨大的科学难题,目前采用
随着集成电路制造工艺的进步和处理器设计技术的发展,单发射处理器凭借其在低成本、低功耗和高可扩展能力方面的优势,获得了日益广泛的应用,表现出了强劲的生命力。为进一步满足
学位
随着互联网上提供相同功能Web服务的数量日益增加,如何找到适合服务请求者需求的Web服务已成为服务计算领域研究的热点。目前普遍关注的基于QoS的Web服务发现的研究工作中还
访问控制是网络安全标准化的ISO国际标准组织在信息系统的安全基础设施的定义(ISO7498-2)必须包括5个安全服务,信息安全和保护一对主要的技术和有效的手段。传统的访问控制是
学位
Maze是目前中国教育网内最大的P2P文件共享系统,系统中有着大量的用户共享文件,Maze中部署着一个提供共享文件查询服务的索引和检索系统。现有的Maze索引和检索系统认为所有
信息和网络技术的发展,给人们传播和获取信息带来快捷和方便的同时,也对信息安全方面带来了挑战。如何保证信息在网络中的安全传输是人们非常关切的问题。传统的加密技术通常
语音识别技术的发展已经有50多年的历史,并达到了相当高的水平。在国内,汉语语音识别也得到了充分了研究,已走出实验室达到实用化的阶段。但少数民族语言的语音识别还处于起
学位