基于近邻密度的自适应谱聚类算法研究及其在入侵检测系统中的应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:hsmwdevil
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谱聚类是一种高质量、适应性强的的聚类分析算法,有良好的理论基础,已被广泛应用于文本分析、图像分割及入侵检测等多个领域。然而,谱聚类在聚类时对高斯核参数灵敏并且要人工输入聚类数目,使得算法有一定局限性。本文针对高斯核参数灵敏问题和人工输入聚类数目问题进行研究,提出能自适应获取高斯核参数和最佳聚类数的谱聚类算法,并将该算法应用于入侵检测系统的初级报警数据聚类分析处理。主要研究工作和成果包括:(1)提出基于近邻密度调节的自适应谱聚类算法。算法定义了新的相似度函数,该函数根据数据点近邻区域的点密度调节数据点间的相似度,使其更接近数据集中数据点的实际分布情况,避免了高斯核参数灵敏问题;同时,相似度计算时,根据数据点近邻点的平均距离自适应计算高斯核参数,避免了人工设定高斯核参数困难的问题。(2)提出基于特征间隙自动确定聚类数谱聚类算法。算法根据矩阵的扰动分析理论,通过特征间隙序列中第一个极大值的下标判定数据集最佳聚类数,解决了经典谱聚类算法需要人工输入聚类数问题。提出基于近邻密度和特征间隙自适应谱聚类算法(DAFG-ASCA)。将基于特征间隙自动确定聚类数谱聚类算法和基于近邻密度调节的自适应谱聚类算法相结合,有效解决高斯核参数灵敏和人工输入聚类数问题。(3)设计实现基于DAFG-ASCA算法的入侵检测系统。系统中报警聚类模块使用DAFG-ASCA算法对系统初级报警数据聚类分析。系统测试结果表明,系统中的报警聚类模块有效减少了传统入侵检测系统报警信息泛滥、冗余。主要贡献:根据数据点近邻区域点密度调节数据点间相似度,设计实现基于近邻密度调节的自适应谱聚类算法;引入特征间隙概念,设计实现基于特征间隙自动确定聚类数谱聚类算法;将上述两种算法结合,设计实现基于近邻密度和特征间隙的自适应谱聚类算法;设计实现了基于DAFG-ASCA聚类算法的入侵检测系统。
其他文献
甲状腺结节患病率在近年来明显上升,恶性甲状腺结节对人体的危害极大。超声图像为诊断甲状腺结节病变提供了重要的影像学依据,但诊断结果完全依赖医生的临床知识和主观判断,可能导致误诊。随着人工智能高速发展,利用深度学习识别甲状腺结节的良恶性,并辅助医生进行诊断具有重要的临床价值。为了提高甲状腺结节良恶性诊断准确率,本文使用高效通道注意力模块和特征金字塔结构改进Res Net50网络,并通过训练得到具有优秀
学位
皮肤癌是目前最常见的癌症之一。从检测和治疗层面而言,研究皮肤病图像分类算法区分恶性与良性病变具有积极意义。鉴于深度学习的迅猛发展,卷积神经网络在皮肤病图像处理中已经取得巨大突破。但是皮肤病类间相似性大、类内差异性小及图像样本有限等问题的存在,使得皮肤病识别算法仍然具有改进的空间。本文主要通过增强网络的特征提取能力和融合多模态特征的方式解决上述难题。(1)为了增强卷积神经网络的特征提取能力,提高多分
学位
多模态医学图像可以弥补各种成像形式自身的局限性,为医生快速诊断和合理治疗疾病提供可靠依据。然而,临床上同时采集不同模态的医学图像需要花费大量的时间和财力。医学图像合成与融合是获得多模态医学图像的可行途径,因此,它引起了医学图像计算界的广泛关注。针对现有的医学图像合成算法需要对不同的输入模态数量分别搭建模型,缺乏通用性和灵活性的问题,本课题提出了一种有监督的可逆变量增强网络(invertible a
学位
医学图像在临床发挥着重要作用,快速、准确地从医学图像中获取器官或病变区域是进行针对性诊疗的基础。然而在现实中,放射科医生从医学图像中量化器官或病变区域并不容易,手动分割一张医学图像大约需要15分钟,这使得医学图像分割成为了一项费时费力的工作。因此,有必要研发出能够定位、分割和量化器官或病变区域的自动化方法,通过采用自动化的医学图像分割方法,能够有效提高医学图像分析的效率,并可以有效降低临床误诊率。
学位
实体关系抽取是自然语言处理领域的一个重要下游任务,其中人物之间的关系抽取任务是实体关系抽取中的典型任务。对语料中的人物关系进行识别和抽取,可以为构建人物社会关系网、生成用户画像以及搭建专家推荐系统提供帮助和支持。针对中文语料人物关系抽取这一课题,本文在分析了人物关系抽取的研究背景、研究现状以及相关技术之后,从标注数据集预处理,再到使用深度学习网络模型完成了中文语料人物关系抽取任务,最后搭建了一个人
学位
保障农产品质量安全已成为最基本的民生福祉之一,农产品质量检测是其中的关键一步。然而当前的农产品检测LIMS(Laboratory Information Management System)系统无法保证检测数据的安全性和可溯源性,无法满足社会公众对农产品质量安全检测的需求。而区块链技术具有不可篡改、可溯源、去中心化等特点,能够充分解决以上问题。因此,本文在农产品检测LIMS系统中引入了区块链技术,
学位
随着计算机技术和国家航天航空事业的发展,一颗颗遥感卫星相继投射空中,遥感图像的分辨率越来越高,也愈发清晰,遥感图像中包含的地表信息不仅能运用于林业、农业、水利等民用领域,还能应用于军事国防领域。目前的目标检测技术在自然图像检测中取得了很好的成果,但在遥感图像方面表现欠佳,这是因为遥感图像本身分辨率很高,图中的关键目标尺寸极小并且多方向密集分布,而背景信息十分冗杂并遍及全图范围,导致在使用传统方式进
学位
幽门螺杆菌(Helicobacter Pylori,HP)感染能引发多种胃部疾病,其发病率非常高,感染人数逐年增加。如果能及时杀灭根除HP,可有效阻止胃黏膜炎症和胃萎缩,更好的预防和控制胃癌的发生。在临床中,幽门螺杆菌感染者病情极容易反复,治疗起来非常困难。传统检测方法存在外界影响因素多,检测方式复杂,病人依从性低的局限性。内镜医生依据丰富的临床经验可通过胃部内窥镜图像判断HP感染,但仅靠医生判断
学位
癌症是影响我国居民健康的主要疾病之一,免疫治疗的发展为癌症患者带来了更多的希望。PD-L1是判断癌症患者是否适宜于免疫治疗的关键生物标志物,所以对PD-L1表达程度的量化在医学领域有着非常重要的研究意义。目前对PD-L1表达程度的量化是通过病理学家直接在显微镜下观察再进行评估的,但人工评分效率低而且主观性较强。为解决以上问题,本文分别对非小细胞肺癌和食管癌两组数据设计了两种基于卷积神经网络的深度学
学位
在医学影像中,肺癌多表现为形状不规则、边缘模糊的结节病灶。借助医学影像区分良性和恶性肺结节并及时制定诊疗方案,是防止病灶恶化、提高治愈率的关键手段。从肺部CT影像中分割出结节病灶可以为肺肿瘤的诊断提供重要参考。近年来,深度学习在医学图像处理中的研究越来越深入,在器官病灶分割的任务中比传统图像分割方法适应性更强、效率更高,但仍存在精度不高的问题。研究以此为背景,构建了针对CT图像中肺结节分割的深度学
学位