论文部分内容阅读
随着网络的普及、计算机技术的日益进步,如今计算机信息安全面临着很大的威胁,恶意代码是其中主要的攻击手段。数目不断增长、技术不断发展恶意代码给人们的生活带来了很多困扰,也导致了个人及企业的经济损失,甚至威胁到国家安全。随着恶意代码的检测技术和反检测技术的不断对抗发展,日益增多的恶意代码给分析人员带来巨大的压力和严峻的挑战。本文研究了基于深度置信网络的恶意代码检测技术,深度置信网络采用半监督学习的方式。首先采用大量无类标的样本来训练受限玻尔兹曼机及深度置信网,其次再用有类标的数据集对深度置信网络进行权值的反馈微调。本文中首先对恶意样本进行查壳、脱壳处理,然后采用n-gram算法构造操作码序列对,使用信息增益和文档频率两种特征选择方法来选取合适的操作码序列特征,最后使用深度置信网络进行分类检测。在实验中,通过选择特征的数量及其他方法来对比分析实验,实验结果通过正确率、误判率、漏报率三个指标进行评价。基于深度置信网络的恶意代码检测模型包含三个模块:数据预处理、操作码特征提取、深度置信网络模块,其中深度置信网络模块为主要模块。深度置信网络模块通过三个具体过程来实现:受限玻尔兹曼机调节、深度置信网络的反馈调节和误差反向传播的反馈微调。受限玻尔兹曼机的调节过程是自下而上的各个层间的调节过程,以这种方式来初始化整个深度模型的权值。而深度置信网络的反馈调节,首先进行自下而上的识别模型转换,然后再进行自上而下的生成模型转换,最后通过不同层次之间的不断调节,使生成模型可以重构出具有较低误差的原样本,这样就得到了此样本的本质特征,即深度模型的最高抽象表示形式。误差反向传播的反馈调节则是针对输出与原始类标的对比,将误差采用BP算法进行微调网络权值。