面向日志分类的蚁群聚类算法研究

被引量 : 0次 | 上传用户:vbcjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对于网络依赖程度的加深,网络安全中的问题以及个人信息和隐私的保护受到了广泛关注,成为研究的热点问题。网络中的设备如服务器主机、防火墙、交换机、路由器等都会记录日志,通过对日志数据的分析来发现网络中的异常行为是研究网络安全的一种重要方法。数据挖掘为从大量数据中搜索关联信息提供了方法。在数据挖掘中,蚁群聚类算法是一种优秀的聚类算法,可以在不具备任何先验知识的情况下实现自主聚类,并且具有灵活性、健壮性和可视化等优点。但是,由于蚁群聚类算法的聚类时间花费较长,在聚类效率和聚类的准确率上都还有很多改进和提高的空间。在日志分析领域,对蚁群聚类算法的研究也很少。日志文本有其自身的特点,如果针对日志文本的特点有效地将日志文本转化为向量,将更有利于聚类的划分。针对以上这些问题,本文对蚁群聚类算法进行了深入的研究,并对算法提出改进。本文首先结合日志文本的特点,提出一种新的将日志转换为向量的方法,该方法使转换后的向量尽量保留了原始日志文本中词的信息。本文从两个方面改进蚁群聚类算法。第,为蚁群设置记忆,记录最近被成功放下的对象及其位置信息,减少了离群点和错分点的数量,提高了聚类的准确率和效率。第二,增加对象适应度列表,改进蚂蚁拾取对象策略,提高了聚类质量。最后,在实验中通过对比不同算法对日志数据集进行聚类的结果,验证了改进的有效性。本文中改进后的算法在时间花费可以接受的情况下,聚类准确率和聚类质量都大幅提高。
其他文献
通过对阅读这一过程进行剖析,就如何提高读者创造性阅读能力提出建议。
<正>家禽种蛋孵化过程中所有相关的设备、用具的卫生状况都直接影响种蛋孵化率、健雏率及雏鸡的成活率。目前孵化机消毒常用甲醛熏蒸消毒法,甲醛刺激性较强,且易残留污染空气
<正>我今年56岁,患阳痿已经2年了,病情一直迁延不愈。两个月前,有位中医建议我服用"千口一杯酒"进行治疗。我在使用此方治疗了半个月后病情得到了明显的缓解,使用1个月后病情
期刊
考试作为检验学生学习知识的掌握程度的重要手段,已经不仅成为各大高校招生、各大企业招聘的重要依据,而且更加成为学生日常学习生活中必不可少的学习任务。考试也被看做是一项
目的探讨认知行为治疗对精神分裂症患者应对方式和生活质量的影响效果。方法选择本院收治的116例精神分裂症患者为研究对象,随机分为观察组和治疗组各58例。对照组患者接受常
<正>本实验研究汉语中三对送气和不送气塞音的音位界限及其范畴知觉。用剪切磁带的方法,改变自然产生的 OV 音节中的送气塞音的 VOT,得到 VOT 在0-60msec 范围,以 5msec 范围
会议
伴随新医改取消“以药补医”政策不断推进,公立医院收入结构受到影响,总体收入下降。随着全民医保推行,医保病人的比例明显提高,医保机构结合广大群众的集体性优势明显,价格谈判降
通过分析我国信息咨询业咨询人才的现状,提出我国咨询业人才培养的方案,并预测我国咨询业人才的发展方向。
在社会主义市场经济体制下,我国大型钢铁联合企业面临着竞争的钢铁市场。鉴于钢铁企业大都建设时期早、工艺落后、设备陈旧的事实,已不能满足市场的需求,企业要占领市场,就必须提
李渔是清初著名戏曲家、小说家,十七世纪因李渔的存在凭添了风流与适意,灵动与才气。其小说创作长期不受重视,研究资料零零散散。近些年来,研究者才陆续多起来。本文试图深入探讨