主动探测式电子商务钓鱼网站检测机制的研究

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:qiaolei8214122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网为人们的生活带来了方便和快捷的同时也带来了威胁。近年来网络欺诈事件频频发生,而网络钓鱼攻击是网络欺诈的典型代表。国际反钓鱼工作小组(APWG)指出网络钓鱼(Phishing)是一种基于社会工程学的在线身份伪造的欺诈方式。网络钓鱼的发展给电子商务和网络营销带来了巨大的危害,如何检测和防御钓鱼网站进而防止网络钓鱼攻击就成为国内外相关领域研究的热点。  目前的钓鱼网站检测和防御技术只是对已经存在的钓鱼网站进行被动防御,由于钓鱼网站生存期较短,所以检测的漏报率和误判率较高。本课题针对现有钓鱼网站检测方法的不足,设计实现了一种主动探测式钓鱼网站检测机制。设计了一种疑似钓鱼网站URL生成算法,该算法基于域名欺诈的钓鱼攻击方式可以尽可能完备的生成与受保护的正常电子商务网站相似的疑似钓鱼网站URL地址;设计了一种提取电子商务网站的web页面身份的算法,以通过web页面身份来初步判定疑似钓鱼网站是否是钓鱼网站;改进了传统的Shingling算法以更好的实现web页面文本相似性的度量,改进了简单树匹配算法以更好的实现web页面DOM树相似性的度量,并综合web页面文本相似性及web页面结构相似性对疑似钓鱼网站进行判定;设计了一种面向钓鱼网站敏感特征选取的改进的信息增益算法IIGAIN,该算法综合考虑了特征项的类内离散度,通过对特征项的类内离散度差值做相应的处理,以处理后的结果作为惩罚项改进信息增益算法,并基于IIGAIN算法选取的最优敏感特征对疑似钓鱼网站进行判定。最终本课题以京东商城为研究实例设计实现了一种由受保护的正常电商网站URL出发对疑似钓鱼网站进行主动探测的钓鱼网站检测机制。  主动探测式钓鱼网站检测机制具有较强的针对性,能起到主动定向地保护网站的作用;同时该机制变被动为主动,对钓鱼网站的危害进行事前防范,有效降低了商家和消费者的经济损失,与现有的钓鱼网站被动检测机制相比,具有更强的应用价值。
其他文献
伴随着新一代网络—语义网的蓬勃发展,互联网资源的混乱、重复和冗余等问题得到了很大的改善。作为语义网的核心,本体研究已经有了很大突破,并在许多科研方向得以应用。然而
SAS(Serial Attached SCSI,串行小型计算机系统接口)是一种面向企业级应用的串行磁盘接口,SAS协议综合了并行SCSI和串行连接技术的优势,是一个以串行通讯协议为基础架构的多
随着网络技术和音视频技术的发展,多媒体应用在人们的生活中扮演越来越重要的角色。而视频编解码技术在多媒体应用中尤其重要。AVS作为我国自行制定、拥有自主知识产权的数字
随着大数据时代的到来,如何管理、利用互联网中已存在的海量数据成为当下的热点。每天用户对于互联网产品的使用都产生大量的历史数据,但一般的搜索引擎并不会利用这些数据,
随着集成电路工艺的不断改进和计算机技术的发展,多核处理器体系结构提供了强大的运算能力,可以极大地提高整个处理器的性能,已经成为处理器的主流。然而,处于不同工艺下的存
JTAG(Joint Test Access Group)烧写工具具有灵活、方便、稳定等特点,因而在嵌入式系统领域得到了广泛的应用。然而,基于仿真器的烧写工具一般都需要配合宿主机才能使用,不具
随着网络技术的发展,互联网逐步超越了单纯的网络模型范畴,而成为一种新的规范的基础应用环境。用户数量的增加、网络资源的不断积累,海量数据的共享等使得网络不同数据源的
太阳活动对地磁场产生干扰,在地球表面产生电势,进而在电网中形成频率低至0.001~0.1Hz的地磁感应电流(geomagnetic induced current, GIC)。由于GIC的准直流特性,会造成变压器的直流偏磁,并产生大量谐波、引起无功变化和振动加剧、噪声增大等次生灾害。更严重的情况会导致变压器、并联电抗器、静止无功补偿器等设备损坏,甚至引发电网失稳。因此,可以把GIC看作电网磁暴灾害
粗糙集理论是一门新兴的不确定性的处理理论和工具。它特别合适不完整、不确定知识和数据的表达、学习、归纳。国内外智能数据处理领域对其理论和应用有着广泛和深入的研究。
随着互联网的迅猛发展,网络已成为人们工作、学习和生活的一个重要平台。网络在提供给人们便利的同时,也产生了很大的负面影响,如不良和非法信息的传播,内网中机密信息的泄露,垃圾