多特征多模型的恶意网址识别检测研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:edward109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今,互联网技术飞速发展,但是随之而来的网络安全问题也日益严峻。识别检测恶意URL是网络安全亟待解决的问题。恶意URL具有时效性强,更新速度快,URL简短且广泛等特点,充分利用URL这些表现特征能够有效地提高分类效率,有利于解决信息数据被盗、恶意传播等网络安全问题。本文针对网络安全领域的算法适用性,改进和优化深度学习模型与结构,运用深度学习算法提取URL多种特征信息,构建多模型的深度学习恶意URL识别检测方法,以此扩展该领域的理论研究,为实际应用提供理论依据。本文的主要研究内容如下:(1)本文利用爬虫技术从phish tank等开源网站上爬取URL数据集,利用数据预处理的方法对数据进行清洗、筛选、过滤等操作,将其处理成规范化的形式。(2)分析了可用于识别检测恶意URL的多种特征。首先,依据信息理论和传统方法标记URL;然后,提取包含词汇特征、结构特征、纹理特征在内的多种URL特征(尤其是字符分布和频率特征),并对缺失的特征值进行处理以构建特征向量;其次,将构建的特征向量输入到预先优化过的模型中用于检测分类。最后,将带标签的URL作为训练集,将不带标签的URL作为测试集,训练算法模型。(3)设计了一种基于注意力的卷积神经网络和长短期记忆网络(a joint approach of Convolutional neural network and Long-short term memory based on Attention mechanism,JCLA)的恶意URL识别检测方法,其相较于以往算法具有更突出的优势:JCLA模型关注多种特征信息,能够从多个层面学习URL特征信息,提高检测性能;JCLA模型结构简单,无需分析额外的语句相关知识,具有较强的鲁棒性和泛化能力;不仅提高了检测效率,而且取得更好的分类效果。(4)考虑恶意URL变种多样性、更新周期时间短,传统的词汇特征不能充分描述恶意URL特性,且深度神经网络模型对恶意URL检测速度慢等问题,提出了一种基于切片循环神经网络(Sliced Recurrent Neural Networks,SRNN)并结合多层卷积神经网络的联合模型(the joint model from concurrently the SRNN with multilayer CNN,CSa C)的恶意URL检测方法。该模型不仅在特征的表达能力以及检测恶意URL的效果明显,而且在检测速度上均优于传统的深度学习模型,并且特征维度越多,CSa C模型的速度优势越明显。
其他文献
水下探测技术的发展是水中对抗、海洋环境监测与资源开发等领域发展的重要支撑。现有基于水声探测原理的水下探测技术存在着固有的局限,很难满足未来复杂水下对抗环境的探测
乐黛云作为中国比较文学学科的奠基人和主要倡导者,从20世纪80年代初期开始一直致力于中国比较文学学科的创建、研究方法的开拓、学术梯队的建设以及研究生人才的培养等工作,其学术视野始终扎根于中华文化沃土,紧跟国际比较文学前沿理论,注重形塑中国比较文学的主体性精神,并将比较文学定位为“跨文化与跨学科的文学研究”。而这样的定位使得中国比较文学迸发出了无限的学术活力与包容性。本文从中国比较文学学术发展史角度
互联网的高速发展,涌现出大量的数据分析需求。传统的数据处理方式只能在数据积累后在磁盘中计算,并且运算时效长,数据量有限。以传统的大数据离线批处理为代表的的分析方法已经不能满足越来越复杂多样的数据处理需求。另外在通用型搜索引擎后时代,针对某个单一领域的搜索被更广泛的使用,但是垂直领域的搜索往往不会针对该领域提供搜索数据的分析,导致对于该领域的搜索数据行为无法有效观测,以致无法制定针对性的搜索策略。为
目的:血吸虫病导致的组织虫卵肉芽肿和纤维化其重要的病理损害。在血吸虫感染早期,机体主要表现I型免疫反应,自成虫产卵开始免疫反应向II型偏移,但具体的分子机制尚不明确。
中国文化随着中国国际影响力的扩大而逐渐远扬。其中,中国饮食文化作为中国传统文化中不可分割且光彩耀眼的一部分,向世界展示着其独特的魅力。为加强中国饮食文化的感染力,翻译中国菜谱意义重大。本次翻译材料《嘉兴·市菜》中菜谱数量较多,以浙江嘉兴地方文化为托,在饮食文化传播和菜肴制作方面具有一定的现实意义。翻译《嘉兴·市菜》可以服务现实生活,促进中国饮食文化的传播,为中国文化国际化奠定基础。本次实践中,为达
输变电工程是保障国计民生的重要基础设施项目之一,其建设质量直接影响着电网安全稳定运行。随着我国“新基建”部署逐步深入,以输变电工程建设为主体的电网建设项目将会愈加增多,所面临的建设质量风险也将是更高层次的挑战。现有的质量管控方案已经不能适应新时代的新需求,研究输变电工程建设质量风险分析及管控系统具有重要实际意义。本文从工程实际需求出发,针对输变电工程建设质量风险分析及管控研究,开展了以下工作:首先
弧齿锥齿轮具有重合度大、转动较为平稳、承载能力强等优势,在汽车、拖拉机、飞机等设备中应用广泛。随着工业技术的发展,弧齿锥齿轮逐渐朝着高速、重载和低噪声的方向发展,其作为动力传输的关键部件,啮合质量直接影响系统的承载和振动等性能,对弧齿锥齿轮进行力学分析显得尤为重要。承载接触印痕和传动误差是衡量齿轮啮合性能的重要指标,而振动速度和加速度则是衡量齿轮振动性能的重要指标。基于计算机技术的飞速发展,有限元
随着对环保问题的重视,世界各国污染排放标准越来越严格,国外各大研究机构也研发了多种污染物排放监测技术与设备,其中固定污染源的排放,尤其是细/超细颗粒物的排放的在线监
根据交通部在2018年底的统计,我国公路总里程数达到了 484.65万公里,其中公路桥梁总数量为85.15万座。近五年来,公路桥梁总数量都是以每年2~3万座的速度递增。但不容乐观的是,现存的40%~60%预应力混凝土桥梁都存在灌浆缺陷问题,比如说在孔道内和锚固区内的灌浆不密实等。预应力弯曲管道的压浆不密实会使管内的预应力钢绞线在氯化物、水和氧气的环境下不断锈蚀,从而引起桥梁结构破坏,严重者甚至会导
寄宿制学校是一种办学模式,它既能解决学生的吃饭与住宿问题,也能解决学生因距离远而求学难的问题。因此,寄宿制学校是解决落后地区、农村地区子女求学的一种重要途径,是我国学校教育的重要组成部分。办好寄宿制学校对提升落后地区、农村地区子女的综合素质有着重要意义。但是,寄宿制学校的封闭性给学生管理带来了巨大的难题。目前,寄宿制学校普遍实行的“看管”模式,这种模式虽然有助于提升学生管理的效率,但也束缚了学生创