论文部分内容阅读
在互联网成为人们必不可缺的生活方式的今天,电子邮件是最为快捷、经济的互联网应用之一。同时电子邮件也逐渐成为包括移动通讯在内的,人们主要的信息交互方式之一。但是,垃圾邮件的泛滥不仅严重阻塞了电子邮件这条全球最经济最便捷的交流通路影响,而且影响国内的邮件服务商在全球的形象,以及中国信息产业的长远发展。
在研究中发现,垃圾邮件过滤所遇到的问题和人工免疫系统所遇到的问题有惊人的相似性。因此,包括垃圾邮件过滤在内的计算机安全领域中出现的问题可以使用免疫系统中抽象的计算模型来解决,所以,人工免疫系统也越来越多的应用到计算机安全领域的研究中。
首次提出了负选择算法的是Forrest,该算法基于免疫系统中自我(self)和非我(non-self)区分的原则,算法的实质是一个二进制空间中的二分类问题。为了提高检测器的性能,在负选择的基础上改进检测器匹配算法和生成算法,同时引入自适应遗传算法和粒子群优化算法(PSO)对负选择算法中的关键参数进行优化,而产生了基于免疫优化算法的海明型空间负选择算法(PGHSNSA)。
PGHSNSA应用了自适应的遗传算法动态的改变检测器个体的变异概率和交叉概率,主要目的是在进化初期这种交叉概率和变异概率的调节方式有较强的全局搜索能力和较弱的局部搜索能力,同时,随着进化的深入,全局搜索能力逐渐减弱,局部搜索能力逐渐增强。自适应的遗传算法可以使在检测器数量一定的情况下,检测器个体能够尽可能的覆盖非我集合空间。海明型空间的引入,使检测器在生成过程中通过海明置换能有效的避免或者减少“空洞”的产生,同时通过r块匹配规则使生产的检测器能更好的覆盖非我集合空间。对于应用在垃圾邮件过滤中的PGHSNSA,最重要的两个参数是检测器的维数和检测器的个数,本文基于PSO对这两个参数进行优化,提出了融合PSO和负选择的优化算法,PGHSNSA算法能在尽可能少的检测器维数和检测器个数的情况下,达到尽可能好的垃圾邮件过滤性能。