一种基于改进的字符特征的恶意域名检测技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:dknight123lin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
域名解析系统已经发展成了一个不可忽视的网络基础设施和信息枢纽,在人们进行日常网络活动中是不可缺少的一环。但是网络恶意域名出现越来越频繁,对域名解析系统造成恶意影响,同时也对国家、社会和人们的生活带来了各个方面的损失。因此,恶意域名检测也显得越发重要。目前恶意域名检测的方法多是基于黑名单匹配和机器学习方法来进行。黑名单匹配的方法依赖于已经检测完成的恶意域名黑名单,时效性弱,更新慢;基于机器学习的方法比较流行,目前一般以域名字符特征作为特征来训练模型,进行分类。但是随着恶意域名生成算法的更新,目前越来越多恶意域名与正常域名差异性变小,通过更改单词中的部分字符来模仿正常域名,故以字符作为特征分类变得不具备明显区分度。本文提出了一种基于改进的字符特征作为分类依据的检测方法。同时本文根据恶意域名网站的恶意诱导内容将恶意域名分划分了具体的类别和比例。具体内容如下:(1)本文首先分析了恶意DGA域名与正常域名在字符组成和分布上的区别,以此为依据选取了域名九个字符基本特征来进行模型训练进行实验,为本文基于改进字符特征的后续域名分类提供了依据。随后分析了研究域名字符的改进特征即词法特征,使用支持向量机算法训练分类模型,然后进行测试得到域名检测结果,并与使用原始字符特征的分类方法进行比较,准确率提高0.7%,精确度提高0.6%。(2)在上述分类检测的基础上研究了短域名分类的效果,提出在SVM模型中增加了隐马尔可夫特征进行训练的分类方法,并对训练后的模型进行了验证,发现该方法对于长域名和短域名均有较好的效果,最终结果准确率超过95.4%,召回率超过96.4%,精确度超过94.4%,准确率、精确度与原始字符特征相比均提高1%以上。(3)本文对恶意域名进行了进一步分类,使用网页请求过滤、网页title关键词与词典库相匹配,子链接信息等对未标记域名做聚类分析的方式将本文恶意域名数据集分成15个类别,并得出了每个类别的分布比例,可满足海量域名数据的分类。本文中对恶意域名进行检测时将原始字符特征改为分词特征能显著提升对新型的DGA域名检测效果,而且HMM系数的添加使得对检测困难的字符较短的DGA域名也能起到好的检测效果。而对恶意域名网站的聚类分析使得种类繁多的恶意域名被划分为特定类别,实现了对海量数据和多种类别恶意域名的分类。
其他文献
雾是一种会使能见度下降的不良天气,它容易令驾驶人驾驶操作行为发生变化,从而为驾驶过程带来安全隐患。基于人机界面(HMI)的车路协同技术对提高雾天高速公路整体安全水平具有重要作用,但其对驾驶人注意力的影响不容忽视。目前车路协同技术应用前测试困难较大,基于车路协同的雾预警系统对于驾驶人的注视分布影响评估有所欠缺,并且对于HMI导致的驾驶人对驾驶环境的注视规律的影响尚不明确。此外,针对视觉特性与驾驶行为
本文讨论了拟线性奇异摄动两点边值问题的基于等分布原理的自适应数值解法及其误差分析。为了证明拟线性算子的无穷模和*模之间的稳定性,我们引入了和拟线性算子间存在特殊的转化关系的线性算子。利用线性算子的格林函数及其解的性质,先是由比较原则得出了线性算子对应格林函数的界,后由线性算子根据内积关联的关联算子是M矩阵的性质证明了格林函数分段单调,利用不等式证明了关于线性算子的无穷模和*模之间的稳定性,最后通过
脑机接口(Brain-Computer Interface,BCI)技术可以帮助人们通过脑电信号来控制机器,从事各种工作,具有广阔的应用前景和巨大的市场潜力。近年来,随着计算机软硬件的快速提升,脑机接口技术发展也变得迅速。但是,脑机接口技术仍处在发展阶段,存在数据的信噪比低和被试间差异等问题,导致分类的准确度较低。基于此问题,本文的主要内容如下:(1)由于不同被试间的脑力负荷程度不同,会影响脑电数
近年来,由于物联网技术与“互联网+”理念的迅速发展,市面上增加了大量基于物联网技术的智能设备。在推进物联网产业的进程中,急需大量熟悉专业技术,具备开发与创新能力的技术型人才,为物联网专业与希望从事物联网相关工作的学生带来挑战。本文基于物联网的思想与架构,设计并实现了物联网实训系统。该系统具有完整的结构,集成多种通信方式、多种传感器、多种执行器,有助于学生理解物联网架构,培养学生的实践能力。物联网实
安全多方计算是近年来随着信息交互的频繁发生,为保护交互信息的安全于1982年由Yao教授首次提出的,是有效保障交互信息安全的一种方法。简单来说是指多个参与者持有各自的私有信息,在互不信任的情况下,相互交换信息,共同合作计算一个函数得到最终的计算结果,且在信息交互的过程中得不到其他参与者的私有数据。安全多方计算目前已经发展为密码学界的一研究热点问题,在现实生活生产中有广泛的应用,本文研究的计算几何问
呼吸运动是哺乳动物维持生命不可或缺的节律性活动,呼吸节律的产生中枢位于哺乳动物延髓腹外侧区一个被称为pre-B(?)tzinger复合体的区域。呼吸节律在正常状态下是均匀而整齐的,而在病理状态下会紊乱且不规则,因此研究呼吸节律产生的动力学机制及其控制有重要意义。本文基于pre-B(?)tzinger中胞体-树突耦合神经元模型,利用相平面分析、分岔分析、快慢动力学分析以及ISI(峰峰间期)分岔序列等
自第三次工业革命以来,信息技术在全世界都有了飞速的发展,我们的生活也发生了翻天覆地的变化,人与人之间的距离越来越近。和之前的通信不发达相比,现在的计算机、互联网、手机等工具为人们的沟通提供了条件,哪怕相隔万里之远,也可以瞬间听到对方的声音,看到对方的表情。但任何事情都有两面性,信息安全隐患也深深地潜伏在我们生活中。密码学是信息安全的重要保证。随着专家学者们对密码学的深入研究,安全多方计算被提出并成
本文研究了渐近非线性基尔霍夫型方程正解的存在性和非存在性.我们的结果还包括非线性项在无穷远处共振的退化情况.据我们所知,我们的正解条件也不同于现有的结果.本文研究了方程(?)(1-1)其中a≥0,b≥0,Ω为RN(N≤3)中的光滑有界区域.假设下列条件一致满足:(f1)f∈C(Ω×R,R)满足f(x,0)=0;(?)(f2)存在μ∈R,使得#12(f3)f3/f(x,t)关于t>0单调不减;(f4
“三山五园”是中国古典皇家园林的杰出代表,也是当今挖掘历史、传承文化价值的重要研究领域。香山静宜园在“三山五园”中占有一山一园,在历史发展的不同阶段均体现出特殊的文化价值。近年来,对于香山静宜园“二十八景”和“别垣二景”的个例研究与复建工程正在逐步开展,“别垣二景”之一的见心斋是静宜园内唯一一处具有江南文人园特色的园中园,其保存完好、文化价值突出,值得深入研究挖掘。当今快速发展的三维数字化技术,为
在大健康的时代背景下,人们越来越意识到环境可以具备一定的恢复性。而研究环境恢复性与偏好关系密切。对于这方面的研究的手段越来越客观,眼动追踪技术就是其中之一。本研究关注的是具有恢复性水景的偏好研究,具体包括对于水景类型、元素、属性的偏好,探究并总结出对应恢复性水景规划建设启示及意见。探究不同类型水景偏好主要采用的研究方法是文献研究法、眼动实验法、问卷调查法等。在探究水景不同元素和属性阶段,以眼动实验