基于文本特征分析的钓鱼邮件检测技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:cheng8023jiajia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络钓鱼攻击主要是通过邮件方式传播的,大量的网络钓鱼攻击使得用户遭受到巨大的经济损失。巨额的损失导致用户不信任网上银行和电子商务网站,并严重影响到电子商务的发展。因此,完成对钓鱼邮件的检测,就可以有效地防止由网络钓鱼行为导致的经济损失。由此可见,钓鱼邮件检测技术的研究是一项很有意义的课题。本文的主要工作和意义在于:1.针对钓鱼邮件的发展趋势,提出几种新的特征用于检测。网络钓鱼攻击者一直在发展其攻击策略,改变钓鱼邮件的特征,从而使邮件能绕过邮件过滤器的检测。因此,邮件特征的选取也必须根据这些攻击策略的改进而有所调整,合适的特征可以提高检测效果。本文结合了当前钓鱼邮件的特点和相应的应对策略,提出几种新的钓鱼邮件的文本特征,用于钓鱼邮件的检测。实验证明,新的特征能有效地提高钓鱼邮件的检测精度。2.采用在线学习的策略,对分类器模型进行必要更新。以往的分类检测过程中,在使用标签好的训练集完成分类器模型的训练后,模型就不再更改。而固定不变的模型,无法应对所有的钓鱼邮件检测,很有可能在检测新邮件时出现分类错误的情况。因此,对分类器进行在线学习更新很有必要。通过更新,可以有效地提高模型的分类精度,降低误判率。实验结果表明,采用了在线学习策略更新分类器模型的效果好于不更新的效果。
其他文献
随着信息技术的快速发展,互联网已经深深融入了人们的日常生活。微博作为互联网时代主要的应用之一在知识分享、信息传递等应用中扮演着重要的角色。微博作为一种新兴的社交
随着市场竞争日益激烈,各行业信息化建设都不断深入,人们或不断构建新的应用系统,或在业务需求的不断变化下改善原有的应用系统,或需要异构不同平台、不同语言的其他系统。而
随着信息技术的飞速发展,信息安全已经成为当今社会越来越关注的问题。密码算法是确保信息安全的核心技术,而密码算法自身的安全性一直以来都是国内外研究学者关注的热点问题。
物联网技术在我国的兴起,给传统制造业带来新的机遇。对于工业缝制行业,借助物联网技术,实时采集生产线中缝制设备和操作工的状态和工作信息,通过无线网络上传到监管中心并及时作
自从互联网开始变革,博客也跟随慢慢崛起,并以惊人的速度发展,到目前为止,博客用户更是达到上千万人。博客已成为人们工作生活必不可少的工具,用户数量的剧增,发表的博客自然也会增
分布式查询处理技术无论在传统分布式数据库环境下还是在数据库网格环境下都是难点问题,而网格环境又具有其特殊性。目前,对网格环境下的查询处理技术的研究和成果较少。本文在
虽然人类基因组计划已经完成并取得了巨大成功,但是遗传疾病致病基因的预测是仍然人类健康领域面临的重大挑战之一。寻找遗传疾病的致病基因在改善医疗护理和理解基因功能等方
拓扑蛋白质组学是蛋白质组学一个崭新的研究方向。MELK技术是拓扑蛋白质组学中的关键技术。多肌炎是自身免疫性结缔组织疾病,特点是肌组织出现炎症导致对称性肌无力和一定程度
传统的机器学习方法假设训练集和测试集来自同一分布的样本集,如果实验数据的分布改变了,需要重新标注新样本作为训练集建立统计模型,然而标注新样本的代价通常很高,采用迁移学习
信息系统安全的紧迫性和网络通信安全的重要性使人们越来越对分组密码的相关理论感兴趣,分组密码的设计与分析也一直是密码学中的热点课题。分组密码作为现代密码学中的一个重