基于关联感知的无监督深度异常检测模型研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:myhotdonkey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常检测已经被广泛应用于网络安全、模式识别、数据挖掘等应用领域。异常检测旨在发现正常模式中的异常模式。无监督异常检测方法通过对样本的概率分布估计来发现异常数据,是当今异常检测主要采用的方法之一。已有的无监督异常检测方法通常只对数据的原始特征进行分析,忽略了数据间隐含的关联性信息,导致异常检测效果不甚理想。本文针对此问题提出了基于关联感知的无监督深度异常检测模型。为了提取数据的关联性信息,本文通过图结构对数据间关联性进行建模。首先,在数据的原始特征空间中,使用k最近邻算法(k-nearest neighbor,k-NN)来对数据的相似性进行分析;然后,根据数据之间的相似性来构建无向图,以此表示数据间关联性;最后,设计数据间关联性挖掘方法,对数据之间关联性信息进行深入挖掘。为了利用数据的关联性信息,本文设计了基于关联感知自编码器的高斯混合模型(Correlation-aware autoencoders in Gaussian mixed model,CAAE-GMM),设计基于高斯混合模型的估计网络,以深入挖掘的数据间关联性信息为输入,估计数据的概率分布,并基于此进行异常检测;然后,在CAAE-GMM的基础上,提出了双路自编码器,设计了基于关联感知双路自编码器的高斯混合模型(Correlation-aware dual-autoencoders in Gaussian mixed model,CADAE-GMM),模型使用两个并联编码器结构,对数据的原始特征和数据关联性信息分别进行挖掘,并将得到的两种特征进行融合,获得融合特征。同时,为减少数据降维过程中信息的丢失,将重构误差作为重构特征与融合特征级联获得数据的低维嵌入,最终将其输入到基于高斯混合模型的估计网络来估计数据的概率分布,并基于此进行异常检测。实验结果表明,本文模型可从不同侧面充分挖掘数据包含的各种特征信息,最大化异常检测模型对各类数据的异常检测能力。
其他文献
PCB板元器件插件的正确与否决定了电路板的质量及生产成本,尤其是带有极性和方向性的元器件的反接将直接损坏电路板,给生产造成损失。而基于自动光学检测(Automatic Optical
目的:随着CT和MRI等影像学检查的广泛应用和体检的普及,无症状性肾癌的诊断率越来越高,局限性肿瘤比例增加,是否在肾癌根治术中同时行同侧肾上腺切除术越来越受到关注。本课题通过回顾性研究方法,对我院收治的肾癌根治术患者进行随访调查,旨在探讨肾癌根治术中肾上腺切除术的临床意义。方法:回顾分析我院2012年1月1日-2018年12月31日收治的386例获得完整随访的肾癌根治术患者临床及病理资料,其中30
印度尼西亚语(简称印尼语)源自于苏门答腊岛东北部的马来语,属于马来-波利尼西亚语系。世界上约有三千多万人将印尼语作为他们的母语,且大约有一亿多人将其作为第二门语言。现代马来语和印尼语都使用拉丁字母拼写,两种语言的拼写也比较接近。论文以开发印尼语文语转换应用系统为目的,设计并实现基于隐马尔可夫模型(Hidden Markov Model,HMM)的印尼语文语转换基线系统,并在此基础上探索提高语音合成
自然语言处理研究是人工智能领域的核心难题,解决该问题的关键是如何让机器正确解析自然语言的语义,并获得某种形式的语义表示。由于自然语言中的句子是承载语义信息的主要单位,因此,准确解析句子语义是实现自然语言语义理解任务的关键。鉴于分布式词嵌入表示已经在机器翻译、自动摘要等自然语言处理任务上取得了成功的应用,人们很自然地想到能否将分布式表示扩展到句子、段落或篇章等长文本,即将句子、段落或篇章的语义表示映
传统的通信物理层技术涉及信道建模、最优采样方案和信号检测等模块的设计以确保数据的无差错传输。由于在诸如水下通信、分子通信场景中信道模型难以用精确的数学模型来描述
在现代化工业进程日趋完善、科技发展日新月异的今天,高端装备制造业正逐步向着自动化和智能化的方向迈进。工业机器人凭借其高自动化、智能化和高效率等特点,在现代工业生产
汞离子是一种常见的重金属污染物,毒性强且难降解,通过甲基化作用生成有机汞,再经食物链在人体内积累会引起各类健康问题,如脑损伤和其它慢性疾病。环境污染严重危害人类健康
Markov跳变系统作为一类特殊的混杂系统,常用来描述因受到外部压力的改变、工作环境的迁移、人为改变系统工作断点和系统内部互相关联的状态发生突变、工作元件的损坏等因素
随着世界人口的急速增长和城市化进程的快速发展,大型公共场所的人群安全问题引起社会广泛关注。一方面,由于大型公共场所空间范围较大,基于单视角视频的人数估计方法已经不
圆形件下料问题广泛存在于许多制造行业中,利用先进的计算机辅助排样技术替代传统的人工排样方式,能够有效提高材料的利用率,对提高企业的生产效率,降低生产成本具有十分重要