融合URL和页面信息的恶意网站识别方法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:hawk_fox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网自发明以来,一直改变着人类的生活,智能化、数字化、信息化的生活方式已经成为现实。目前互联网领域网站数量急剧增加,网站质量审核任务繁重,导致网站质量参差不齐,存在着很多的安全隐患。在这样的背景下,不法分子通过刷单兼职、恶意网站、网络贷款等各种方式进行电信诈骗,严重威胁着人民群众的财产安全。为此,国家出台了相关政策法规对电信诈骗行为进行打击,但是鉴于网络环境的复杂性和灵活性,不法分子手段花样百出,极大地增加了打击的难度。通过分析现有的恶意网站,可以发现恶意网站之间存在着较强的相关性和相似性,呈现出一些共有的特征,除此之外,不法分子为了节约成本,会通过模板化的网站生成工具生成更多的相似网站,网站形成具有一定规律的谱系结构。所以提取恶意网站中存在的特征,找出恶意网站之间的相似性,对于提升恶意网站发现效率,严厉打击非法网站诈骗等行为具有非常重要的现实意义。针对恶意网站的识别研究方面当前存在识别准确率低、模型训练时间长的问题,本文提出了融合URL和页面信息的恶意网站识别方法,在研究过程中将恶意网站的识别看做分类问题,根据不同信息的特征,将恶意网站的URL特征信息和恶意网站的文本、图像特征信息分别进行研究,结合不同信息的特征,设计了两种恶意网站识别模型:(1)基于BLVGG16的URL多特征增强恶意网站识别方法研究:结合恶意URL具有的典型强先验规则,将这些典型先验知识用于增强融合了Bi-LSTM与VGG16的深度神经网络模型(简称BLVGG16模型),从而将符号知识与神经网络进行融合。该方法可以有效减少数据标注工作量,增强模型的可解释性,加快模型的参数学习收敛速度以及提高模型在小样本下的分类精度。(2)基于Bert-Res Net的多模态恶意网站识别方法研究:针对恶意网站中非结构化文本和图像存在的特征稀疏问题,首先提取网站中的图像和文本数据,然后利用Bert模型和Res Net-50模型分别实现网站文本和图像的特征提取,提出了Bert-Res Net模型,探索文本特征和视觉特征对模型效果的影响,实现了多模态的恶意网站识别方法,提高模型准确率。
其他文献
长周期的疫情防控对全球的经济运行态势、消费行为方式等都造成了较大影响,对依靠人群集聚消费和线下积极参与的健身行业的影响更是巨大,对商业健身俱乐部的运营与管理也带来了严峻挑战。服务质量作为商业健身俱乐部的立足之本,但在新冠肺炎疫情的冲击下,怎样调动员工的服务积极性,从而提升服务水平是商业健身俱乐部的管理者亟待解决的难题。研究基于社会学习理论和社会交换理论,对服务型领导与商业健身俱乐部的研究进行系统回
学位
随着社会的不断发展,互联网技术在全球迅速普及,基于互联网,各类信息化技术也飞速发展,全球数据呈高速增长,大数据等信息技术深入影响着人类的生产生活方式。同时,世界各个国家都把推进大数据建设应用作为国家创先发展的重要抓手。如何搭上“大数据与智能化”这一高铁,不断推进公安工作高质量发展,成为现代公安研究的重要方向。但是,在当前公安部门高速推动大数据应用的背景下,济宁公安大数据应用工作仍存在一些问题环节,
学位
当今全球网络信息技术发展非常迅速,移动互联网极大改变了我们的日常生活,各种应用层出不穷,全面融入生产生活的各个角落,相应的用户数量也在急剧增长。在这个大背景下,网络安全问题也变得越来越严峻,不断出现很多新型的安全漏洞和攻击方式。传统的网络安全防御往往要依赖安全专家的知识广度和深度。但是在如今海量的应用程序和数据之下,这种专业人才的防护方式逐渐无法满足要求,很多学者开始把自动化引入这一领域来应对这个
学位
近年来,随着社会对自闭症谱系障碍的关注度越来越高,人们从不同的角度创作了许多有关自闭症谱系障碍的作品,以便更全面的向社会介绍什么是自闭症谱系障碍,这些作品以纪录片、电影、绘本等多种艺术表现形式呈现。本文选取了四本描述内容为自闭症或自闭症谱系障碍,表现形式为绘本的多莉·格雷儿童文学奖获奖作品作为研究对象,旨在回答以下三个问题:(1)自闭症儿童英文绘本读物中使用的模态有什么特点;(2)自闭症儿童英文绘
学位
随着网络世界的高速发展,人们的生活方式变得更加方便快捷,万物互联触手可及。与此同时,网络安全带来的问题也越来越凸显,来自网络世界的攻击层出不穷、甚嚣尘上,网络安全所引发的经济财产损失不计其数,网络安全已经成为网络世界中迫切需要解决的难题。面对现如今错综复杂、更加隐蔽的网络入侵行为,传统的防御技术如防火墙和入侵检测系统(Intrusion Detection System,IDS)等,已经难以满足网
学位
在能源系统低碳转型背景下,抽水蓄能机组兼具发电与储能能力,在促进风能、光能等可再生能源消纳过程中承担着重要角色。新型可变速抽水蓄能机组因其快速功率调节、变速恒频运行、工况转换迅速等运行优势,能够有效缓解新能源发电功率波动对于电网的负面影响,但随着机组转速与电网频率解耦,机组运行稳定性问题需要重点关注。可变速抽水蓄能机组为复杂的水-机-电耦合系统,由水泵水轮机、双馈电机、引水与尾水系统及控制系统组成
学位
网络媒体时代,舆论形势不容乐观,各种问题层出不穷,民粹主义近年来活跃在网络舆论场域,并和一些贫富差距、社会阶层分化等现实社会热点问题相互结合起来,对社会稳定发展产生一系列重大影响,引发了广泛关注。如何看待民粹主义问题,很大程度上决定了国家如何治理舆论。因此,当前理论界亟需重新回顾、审视民粹主义,以关切重大现实需要。本文将民粹主义放置在中国社会结构语境之下去进行研究、分析、反思,试着对民粹主义已有各
学位
民族教育概念所指是民族教育理论和实践研究的基础,其是否清晰将直接影响民族教育的研究指向。本研究主要采用文献研究的方法,梳理了中华人民共和国(以下简称“新中国”)成立以来的民族教育相关政策法规、领导讲话、学术研究中所包含的民族教育多种概念所指,并对不同民族教育概念所指产生的背景作了深入分析,以期明晰民族教育概念所指的未来趋向。除去1966年-1976年民族教育基本停滞的时期,中华人民共和国民族教育概
学位
互联网经济迅速发展的背景下,黑客(hacker)通过黑客技术进行非法侵入、窃取、破坏他人计算机系统来实现个人目的,对计算机系统和网络安全构成了巨大威胁。黑客社区作为新兴数据源可以为研究黑客行为提供载体,是黑客们聚集讨论的场所,为分享黑客信息与合作攻击提供便利。黑客社区中信息分享的动机表现出双重性,既会围绕有关恶意攻击、漏洞等与网络犯罪有关主题进行探讨,又不乏着力于抵抗网络攻击与防御技术的研究。攻击
学位
民国时期山西常年饱受疫灾侵扰。据研究统计,民国期间山西省疫灾年数为38年,基本每一年里都有不同数量的县因疫病而受灾。山西在民国时期有五次较大范围的疫病流行;一些县甚至成为某些疫病的主要发病区。面对严峻的疫病卫生状况,政府进行卫生防疫建设显然十分必要。疫病如战争,政府在应对突发的疫情时,不亚于在打一场“遭遇战”。自民国建立到抗战爆发以前,山西基本由阎锡山为代表的地方势力所统治,此时的卫生防疫的体制基
学位