论文部分内容阅读
上世纪八十年代以来,互联网及其技术得到了迅猛的发展,人们从那时开始便进入到了一个称之为“信息爆炸”的时代。互联网的出现和发展不仅使得信息的采集、传输的规模和产生的速度达到了空前的水平,而且在很大程度上改变了现代人类的生产和生活方式。现代科技的发展给人们带来便利的同时,也产生了海量的知识和信息。这些知识和信息以几何级数的增长速度在不断地增长着,对人类的发展造成了有利影响的同时,也带来了不少的不利影响。要解决“信息爆炸”给人类带来的不利影响,必须从有效的行政管理和技术革新两个方面入手,才能有效地解决这个不利影响。从管理层面上说,各国政府必须通过高效的行政管理,从信息产生的源头控制“信息垃圾”的产生。从技术革新层面上说,在信息技术领域,许多的专家、学者都致力于数据库技术、信息挖掘技术等相关信息处理技术的研究,并且已经有很多不仅在理论上而且在实验中表现非常优秀的技术被广泛地应用于信息处理的相关领域中,其中大部分都得到了很好的发展,为解决“信息爆炸”带来的不利影响做出了不俗的贡献。文本分类技术作为信息挖掘技术中的核心技术之一在这一技术革新的大潮中,同样也得到了广泛的应用和长足的发展。文本分类技术近年来也是计算机技术领域中最活跃的技术之一。在科技日新月异的时代,许多的学科之间互相交融,产生了许多新的学科,其中仿生学与其他技术的交融较为常见。因而很多的学者试图将文本分类技术领域与仿生学相结合,在文本分类技术领域开创了一种新的思路。其中比较有代表性的便是基于蚁群优化算法的文本分类算法。本文针对基于蚁群优化算法的文本分类算法Ant-Miner所固有的易陷入局部最优解、复杂度较高等缺陷,引入最大-最小蚁群系统(MMAS)并通过规则质量的变化动态自适应地对信息素的浓度进行调节,引入基于密度的启发式因子来降低计算启发式因子的复杂度,同时通过先验知识来降低条件项选择概率的计算复杂度,在此基础上,本文提出了改进的Ant-Miner算法。