【摘 要】
:
近年来,随着大数据,人工智能,云计算等技术不断创新发展,人们的生活更加方便以及智能化。但伴随着科技技术革新所带来的的便利性的同时,网络攻击也开始变得日益频繁,并且呈现飞速上升的趋势,其中以僵尸网络为主要攻击手段的黑客团体造成的破坏力以及影响力尤甚。如今的僵尸网络为了规避黑名单的检测,通常会使用域名生成算法(DGA)来在短时间内产生大量域名,然后利用这些域名进行连接通信,借此控制大规模受感染的主机,
论文部分内容阅读
近年来,随着大数据,人工智能,云计算等技术不断创新发展,人们的生活更加方便以及智能化。但伴随着科技技术革新所带来的的便利性的同时,网络攻击也开始变得日益频繁,并且呈现飞速上升的趋势,其中以僵尸网络为主要攻击手段的黑客团体造成的破坏力以及影响力尤甚。如今的僵尸网络为了规避黑名单的检测,通常会使用域名生成算法(DGA)来在短时间内产生大量域名,然后利用这些域名进行连接通信,借此控制大规模受感染的主机,使它们成为攻击者手中的“肉机”,对攻击目标的网络发起大规模攻击。因此检测由DGA产生的恶意域名对于防范僵尸网络有着重要意义。随着深度学习在各个领域的广泛使用,针对恶意域名的检测也由传统的特征提取结合机器学习的方式,转向应用深度学习的技术来对恶意域名进行检测以及分类。但目前由于恶意域名家族数据庞大,不同类别的家族在数量上存着在不平衡问题。另外近些年一些家族会通过单词词典的方式来产生域名,针对该类的恶意域名检测也是一大难题。所以针对以上两个问题,本文开展的具体研究工作如下:(1)针对域名家族数据不平衡的问题,本文的主要工作是通过结合CNN以及RNN在数据特征提取方面不同的侧重点,把两者的优势结合起来,可以针对性的提取更加有效的特征信息,使得整个的检测方法在效果上能够更加有效,同时通过引入Focal loss损失函数来解决恶意域名家族数据不平衡的问题。通过在公开数据集上进行的二分类以及多分类实验对比,验证了本文检测方法的有效性以及可行性。(2)针对基于词典的恶意域名家族分类效果差的问题,本文的主要工作是通过使用N-gram模型来提取针对域名数据的2-gram特征向量,并且结合字符向量来形成混合向量。在神经网络特征提取方面,在经典Text CNN模型的基础上,通过借鉴谷歌提出的经典Inception结构来对卷积模型进行改进。在多尺度卷积下,加深卷积层的深度,并且引入Batch Normalization层来减少模型的参数以及计算量。之后使用自注意力机制层,赋予域名数据中不同信息以不同的权重大小,去除其中的信息噪声,最后用全局平均池化层代替全连接层,提升模型的泛化能力,并且在之后通过模型的对比实验来验证该方法在二分类以及多分类上的有效性。本文的创新之处包括:(1)提出了一种基于CNN-BiGRU的恶意域名检测方法。该方法充分利用CNN以及RNN两种模型在特征提取方面不同的能力,在保证二分类效果最佳的同时,还通过引入Focal loss损失函数来解决恶意域名家族数据不平衡问题。在二分类实验中比起单一的CNN以及RNN模型检测准确率分别高出了0.12%和0.19%,在多分类实验中高出了2.89%和1.43%。(2)提出了一种基于Attention-CNN的恶意域名检测方法。该方法通过N-gram模型来提取出针对域名数据的混合向量,之后对卷积网络层进行改进以及结合自注意力机制,针对性的解决基于词典的恶意域名家族分类效果差的问题。在二分类实验中检测精确率为99.07%,为对比模型中的最好成绩。同时在多分类中针对新近出现的恶意域名家族也达到了不错的分类效果,尤其在基于词典的域名家族表现上,本文的方法在精确率、Recall值、F1值上均好于进行比较的混合模型。
其他文献
本研究在梳理角色认同相关文献的基础上,采用网络电子问卷发放和半结构化访谈的调查方法,从自我角色、特殊角色、社会地位、自我期待四个维度上了解高等职业院校教师角色认同的现状,利用SPSS 23.0统计软件对调查数据进行统计与分析,同时对半结构化访谈资料进行整理,归纳出高职教师在角色认同过程中存在的问题及影响因素,并提出有针对性的解决策略。通过对高职教师角色认同整体情况的了解以及对不同性别、年龄、教龄、
随着金盾工程的开展和智慧警务的推进,公安机关信息化建设迅猛发展、信息技术日益成熟,公安工作越来越依赖于信息系统,信息安全的重要性与日俱增。公安机关信息系统汇集着涉及国家秘密和公民隐私的海量信息,一旦出现信息安全问题不仅影响公安业务的正常开展,甚至会损害国家安全和人民群众的切身利益。因此准确识别公安机关信息安全风险因素,构建科学、有效的信息安全风险评估模型,采取适当的风险防范措施对提高公安机关信息安
分布式数据存储因其具备海量存储、易扩展和低成本的优点已成为企事业单位大规模数据存储的主流方式。但随着系统规模的不断扩大,存储数据磁盘的负载不断增加,存储节点出现数据故障已是常见的现象,影响了数据存储的可靠性。多副本技术通过创建数据副本写入多个不同储存节点,能大幅提升数据存储的可靠性,但其存在存储开销过大的问题。局部修复码(Locally Repairable Code,LRC)采用将数据节点进行分
中华民族文化基因的核心内容是思维方式和价值观念。“天人合一”的原型意象构成了中华民族的基本思维模式;以“中”达“和”的“中和”思想是中国传统文化的价值追求。以中华文化基因为理论基础,对北京中轴线的文化内涵进行根本性剖析,力图深化北京中轴线申遗的理论依据与价值内涵。一方面,对“中”的字源及“尚中”思想溯源,以阐明历代都城营建中轴线的发展脉络蕴涵着崇尚“中和”的价值基因;另一方面,探究“礼贯天人”礼法
NAND闪存凭借着读写速度快、体积小和容量大等优势,成为数据存储的主流存储介质。2D NAND闪存在物理尺寸上已经接近极限,限制了存储容量提升。3D NAND闪存通过在垂直方向上进行堆叠,大幅提升了存储容量,但对存储可靠性带来了新的挑战。随着3D NAND闪存的广泛普及,提升3D NAND的数据存储可靠性是当前存储领域的研究热点之一。尽管以往的阈值电压检测技术和基于软判决的低密度奇偶校验(Low-
网络化控制系统(Networked Control Systems,NCSs)是集成传感器、控制器、执行器和网络的复杂系统。相较于传统的控制系统,网络化控制系统显示出许多独特的优势,如灵活的体系结构、较低的安装和维护成本,以及高效的数据传输效率。因此,网络化控制系统在交通管理、机器人控制、移动传感器网络、远程手术、无人机和远程控制等领域都得到了广泛的应用。然而在实际应用中,由于网络的共享特性,特别
智能时代,大数据、云计算等高新技术的快速发展,使得公安情报工作建设朝着专业化、信息化、规范化等目标持续奋进,公安情报队伍建设迈上了新的台阶,对公安情报人员也提出了更高的要求和标准。本文着力于研究公安情报人员的成长发展,探究成长路径,构建公安情报人员成长模型,期冀推动公安情报人员的知识创新与能力提升,促进公安情报工作的平稳运行和升级发展。在文献分析的基础上,首先,介绍了本研究的背景、意义与内容、方法
冲突控制是指个体克服无关信息的干扰,将精力集中于目标刺激的能力。冲突适应是衡量冲突控制的指标之一,可以考察个体连续的冲突控制能力。我们每天都需要对各种信息进行冲突控制,包括社交活动中产生的社会信息。而自闭症以及高自闭特质个体对社会信息的加工异常已经得到证实,那么对社会信息的异常加工是否会影响他们对社会信息的冲突控制?本研究采用冲突适应这一指标,考察了社会信息对高自闭特质个体不同类型冲突控制的影响,
近年来,由于物联网、人工智能、5G等智能信息技术的快速发展,加之先进的网络通信模式,这使得网络空间中的在线服务数量不断增加。随之而来的是网络安全事故发生的风险也在不断上升,各种新型网络攻击可能会对国家和社会安全造成极大的威胁和伤害,这需要引起全体网络安全研究人员的高度重视。恶意网络流量检测系统可以作为应对上述问题的可靠方案,但是在面对海量的高维网络流量数据时,目前的恶意网络流量检测方法在准确率和泛
云计算是一个异构的分布式计算平台,通过虚拟化技术为用户提供方便可扩展的网络、服务器、存储、软件等资源服务。近年来,随着云计算作为信息技术产业的发展重点,全球的各行各业都开始利用云计算,并依此开展信息化转型的进程。同时随着互联网的发展与5G技术的逐渐普及,高速的网络通道与廉价的算力这些优点都使将计算移交到云端成为一种必然趋势。随着云计算业务的日益增长,其庞大的负载规模与动态变化的特性为其任务调度带来