基于深度学习的网络流量异常检测及隐私安全防护研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:nihaonan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着5G、人工智能、大数据、工业互联网等新型基础设施建设的开展,网络己经渗透到了人们日常工作和生活的各个方面,但同时也带来了很多安全问题,各种类型的病毒、漏洞、攻击都造成了巨大的损失,同时也对数据保护、安全防护等方面提出了更高要求,如何保障隐私和数据安全成为当前最大挑战。网络安全的重要基准之一是检测网络异常的能力,机器学习、深度学习等智能方法被广泛应用于异常流量检测,但是网络规模持续激增,海量动态多变的大数据维度也随之增加,并且网络犯罪的手段越来越隐蔽,导致传统的安全检测的方法无法满足安全攻防的要求,能够挖掘到的危险信息有限。另外,特征工程方法中额外的描述信息将会提升实验的时间复杂度和和最终模型的复杂度,将极大的提升计算时间,并造成“维度灾难”。针对隐私保护方面,新型的基于生成对抗网络(GAN)的攻击可以打破协同深度学习的防护方法,还原出训练数据集,从而使得用户隐私信息泄露。如何在不泄露个人敏感信息的前提下提升数据可用性,是当前深度学习应用面临的主要问题,将极大影响深度学习未来的发展。本文主要研究了复杂场景下异常流量检测技术、基于双向长短期记忆网络(LSTM)误植域名检测技术、基于域名(URL)嵌入的恶意域名检测技术、基于协同深度学习的隐私安全防护技术。主要工作和创新成果如下:(1)针对海量数据进行大数据分析过程中的数据倾斜问题,以及集群中总是有任务发生超时、内存溢出现象造成的性能障碍的困境,提出了一种基于自适应学习率和动量的小批量梯度下降(mini-batch stochastic gradient descent,mini-batch SGD)铰链分类算法来检测异常数据,最大程度地减少安全攻击的影响。与传统的神经网络、决策树和逻辑回归相比,该算法在规模和速度上都大幅度提高了深度网络训练的性能,将整个训练集的损失函数最小化,得到近似全局最优值。我们采用异步批量梯度下降算法,从序列化和压缩的角度来进行调优,采用批量梯度下降算法来训练数据子集,减轻参数服务器的压力,解决了大数据Shuffle阶段的数据倾斜问题。通过实现该算法的并行框架,加快海量数据的处理速度,大幅减缓了参数服务器的负担。(2)针对海量网络数据及复杂高维入侵行为特征等安全挑战时,传统检测技术存在建模能力不足及“维度灾难”等问题,提出一种基于双向LSTM误植域名检测技术,提升在大规模域名集合上进行误植域名检测的速度。通过对长短期记忆神经网络和卷积神经网络的研究,运用分层次抽象思想,能学习非常复杂的函数,能更好地应对大量的高维复杂数据,提高建模能力,提升在大规模域名集合上进行误植域名检测的速度。已有的误植域名检测工作大都以计算域名对之间的编辑距离为基础,并未充分挖掘域名的上下文信息,且对短域名的检测易产生大量的假阳性结果。采集域名相关信息进行判定可提高检测效果,但会引入非常大的开销。采用基于域名字符串的轻量级检测策略,并引入双向LSTM来充分利用域名上下文,提升检测效果。通过设计面向域名的局部敏感哈希函数,将提升在大规模域名集合上进行误植域名检测的速度。通过改进了基于编辑距离检测方法的不足,能够有效地进行误植域名滥用检测。(3)针对海量的恶意域名隐蔽性和动态多变的特性,提出了一种基于域名嵌入的无监督学习算法来取代特征工程的方法,有效提升对于恶意域名特征的提取效果,进而提升检测的性能。机器学习算法可以帮助我们更容易地识别隐藏在庞大流量中的异常信息或恶意域名,优质的特征可以大幅提升机器学习模型的性能,特征工程任务必须在内存中执行,但同样也会产生人为主观因素的干扰以及维度灾难。通过基于时间序列的深度神经网络的模型提升对于恶意域名特征的提取效果,建立并存储URL和其相对应的分布式表示之间的映射,并探究了 URL嵌入模型的一些关键参数,解决了由于特征工程带来的人为主观因素的干扰以及维度灾难问题,有效提高了恶意域名识别的性能。(4)针对生成式对抗网络的攻击造成的协同深度学习训练过程中严重的隐私泄露问题,提出了一种基于深度卷积生成对抗网络的隐私保护方法,有效提高基于生成式对抗网络攻击模型的防护效果。在协同深度学习训练的过程中,基于深度卷积对抗生成网络的隐私保护方法存在严重的信息泄漏风险,该方法在深度网络参数传输过程中采用加密传输,设置埋点可以检测网络中的生成式对抗网络的强力攻击,通过调整训练参数,使得基于GAN模型攻击的训练失效,从而有效地保护了信息。在此基础上,提升基于深度卷积生成对抗网络的隐私保护方法的稳定性并通过实验验证其有效性。
其他文献
目的:分析小青龙汤在治疗咳嗽变异性哮喘中的作用。方法:对20例确诊病人与此30例进行对照。两组均在治疗前后测定痰中嗜酸性细胞计数及PEFR。对照组用酮替芬,每次1mg,一日2次
会议
慢性阻塞性肺病患者常存在长期慢性呼吸困难,呼吸肌疲劳及咳痰无力,合并感染、心功能不全等情况使病情进一步加重,通气功能进一步恶化,导致呼吸衰竭,严重时可发生肺性脑病,部
扫描隧道显微镜除了表面的形貌表征以外,还可以进行谱学测量。扫描隧道谱及其傅里叶变换的测量,将扫描隧道显微镜的探测范围从单纯的表面、晶格、杂质,扩展到了材料电子结构
裂隙广泛存在于岩石介质中,准确地描述它们的分布、表面形貌和拓扑关系以及它们对流体运移的控制机理对岩体稳定性评估、地下工程安全生产以及水资源安全和合理利用等问题具
诬告现象是社会不良风气的必然产物,追逐私利是诬告行为产生的基本动因,惩戒成本较低在客观上助长了诬告行为。诬告行为所体现的是监督权异化和责任失衡的问题,我们要在制度上完
目的 观察分娩球和自由体位助产护理在初产妇中的实施效果.方法 选取2014年12月~2015年12月期间我院接受的产妇90例,采用随机数字表法将其分为两组,观察组和对照组,每组各45
蝉科Cicadidae昆虫的若虫长期在地下生活,成虫寿命短,扩散能力低,是研究物种形成和生物地理较为理想的模式生物。该类群鸣声可以用来快速评估分布区物种的多样性,尤其对隐存
为实现园林风景名胜资源可持续利用,实现行业持续、稳定、健康发展,本文拟就园林风景名胜行业实施CI战略的特点、功能及作用,结合现状作了较为全面的阐述和探讨。
<正>一直以为,为天籁之音制器是天底下最浪漫的职业,寻艺二胡却彻底改变了这个想法。二胡大师王国兴的工作室在一幢长满爬山虎的苏俄式二层红砖房里,满目疮痍,没有一点诗意。
水稻是延边朝鲜族自治州主要粮食作物之一。而历年水稻产量的丰歉,在目前农业技术水平的栽培管理下,还主要受着气象条件的影响与支配。因之,探明本地区农业气象条件对水稻生