基于迁移学习的多态蠕虫特征自动提取算法研究

来源 :河北师范大学 | 被引量 : 0次 | 上传用户:liwenwu042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展及云计算、云存储等服务框架的快速应用,互联网的安全面临着严峻的挑战。借助灵活多样的多态机制,多态蠕虫在每次感染主机时能改变自身表现特征,从而有效避开传统入侵检测系统的检测。因此,如何准确且快速提取多态蠕虫特征对防御其快速传播至关重要。本文研究内容主要包括以下三个方面:(1)提出了一种基于改进词频-逆文档频率(TF-IDF)的多态蠕虫特征自动提取算法。首先利用特征哈希方法对不同位置子串赋予不同的位置权重,并将高维子串向量压缩成低维向量;其次,引入校验值对传统IDF算法进行修正,减小稀有子串的权重影响;最后,按权值排序得到子串序列,生成蠕虫特征序列。结果表明,该算法在噪声干扰下能够快速且准确地提取出所有蠕虫的特征,优于同类算法。(2)提出了一种基于Gram-RBM的多态蠕虫特征提取模型,可自动生成多态蠕虫特征序列且具有良好的可扩展性。该模型首先在改进平滑N-gram算法上给出了三个不同元数下的两种平滑改进方法选取策略。其次,根据改进TF-IDF算法将改进平滑N-gram生成的特征序列进行特征转换,之后使用Gaussian-Bernoulli RBM对高维度特征序列进一步降维。结果表明,该模型能够在消耗较少计算机资源前提下更快速准确地提取出多种类多态蠕虫行为特征。(3)提出了一种基于迁移学习的多任务神经网络特征提取模型,利用MoE(Mixture of Experts)神经网络对Gaussian-Bernoulli RBM所保留的部分训练参数进行迁移并训练。首先构建MoE多任务神经网络模型,确定任务分发流程;其次,利用迁移学习重用已有的Gram-RBM模型并与MoE神经网络对接,进而自动提取出多种类多态蠕虫特征。结果表明,所提模型不仅可以提取出多态蠕虫特征,还能够对其他恶意软件进行家族分类,且分类结果优于同类方法。同时也验证了迁移学习不仅能够将已有模型数据迁移到新的模型确保高效的生成多态蠕虫特征,且迁移学习为多模型的融合提供了新的思路。
其他文献
利用中尺度数值模式WRF,结合多普勒雷达资料、卫星TBB资料和自动站资料对2012年8月6—9日由台风海葵引发的杭州西部山区强暴雨洪涝灾害进行分析。结果表明,登陆台风内部的螺
粮食生产是关系国计民生的重大问题,粮食生产者能否获得足够的收益关系到粮食生产安全。本文对2004—2016年河北省小麦和玉米的生产成本、利润以及销售价格进行分析,认为河北
目的识别城市生活垃圾的收集、清理、转运、接收作业接触的常见肠杆菌科细菌,分析其危害程度,筛选关键控制点。方法采用现场职业卫生调查法、系统工程分析法、文献复用法、危
加热炉作为钢铁领域轧钢热处理中的一个重要设备,其炉温控制效果和自动控制水平直接关系到钢坯的质量与产量,而加热炉的炉温控制较为复杂,炉膛中的燃气燃烧过程受到外界多个
共享办公巨头WeWork近日表示,其已于去年1 2月递交IPO申请。Wework可能成为今年美股市场继Uber之后的第二大IPO。5月15日,氪空间宣布完成10亿元融资,由IDG资本、歌斐资产、逸
雨水花园、雨水渗井是海绵城市建设中典型的低影响开发措施,目前国内外针对两者的研究主要集中在结构设计、应用效果等方面,然而此类设施在雨水径流集中入渗条件下对土壤、地
苦草 ,俗名扁担草 ,系沉水植物。它的根系发达 ,生长快 ,具有净化水质的作用。蟹池内栽种苦草 ,可为河蟹提供良好的生态环境 ,使河蟹生长迅速、体质强壮、疾病少、规格大、产
期刊
随着社会经济的不断发展,市场上各种行业迅速发展,市场竞争力也是不断增加,这导致一些企业为了在市场竞争中取得一席之地会采用不合规定的生产方式。在食品行业中,不规范的操
我国的土壤重金属污染十分严重,其中镉污染现状不容乐观,目前常用土壤重金属污染修复的方法均存在一定的局限性。吸附法是一种常见且有效地处理重金属镉的方式,关于镉吸附材
校园安全隐患管理是稳定教育发展的关键。随着近几年校园安全问题不断增多,引起了社会各界的热切关注,同时当前校园安全隐患管理工作中存在的不足,阻碍了我国教育事业长远、