基于组织型P系统的DNA-GA算法研究及其在聚类中的应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:xxzxzzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA-GA算法本质上是建立在DNA编码上的遗传算法,是将进化计算领域和DNA计算相结合的一种表现形式。DNA-GA算法所采用的DNA编码方式与传统的二进制编码相比较起来更加灵活,并且还可以进行较多的遗传操作,这就使得DNA-GA算法相对于遗传算法来说,可以表达更多的遗传信息。所以DNA-GA算法能够在更大程度上克服GA算法所存在的某些局限问题,比如算法的早熟收敛、二进制海明悬崖问题等,因此DNA-GA近些年受到学者们的广泛关注。当下设计出更有效的DNA-GA算法,为人类研究做出贡献,具有很强的理论和现实意义。膜计算又称P系统,是从生物细胞、组织或器官的功能和结构中抽象出来的具有分布式的并行计算模型。从计算效率角度来看,P系统能够在线性时间内求解NP难问题,因此能够在计算智能方面为人们提供较多的方便。到目前为止,膜计算已被广泛应用于众多领域,例如:计算机科学,生物学,语言学,近似优化,计算机图形学,经济学,密码学等。膜计算的应用研究相对于理论方面研究,目前尚处于初级阶段,学者们期待P系统在应用领域上会有突破性进展。聚类分析属于无监督学习的一种技术,也就是说本身具有独立的学习能力。聚类的整个过程可以描述为:将整个数据空间中的每个对象根据欧式距离分别划分到不同的簇中,距离较近的对象会被划分到相同的簇中,反之距离较远的对象会被划分到不同的簇中,最终使得同一类中的对象尽可能地相似而不同类中的对象尽可能地不同。随着聚类分析的研究发展,其在模式分析、机器学习、数据挖掘、文档检索、图像分割、模式识别等领域都有十分广泛的应用。本文就是在以上所述的理论前提下,以膜计算模型中的组织型P系统为基础,提出了基于组织型P系统的DNA-GA算法(TPDNA-GA)。主要涉及三部分的创新:一、对基本DNA-GA算法中涉及的遗传操作进行部分修改,提出了基于新型重构交叉算子的改进DNA-GA算法;二、将改进后的DNA-GA算法与组织型P系统相结合,结合的主要目的是利用组织型P系统的极大并行性和膜规则来提高DNA-GA的性能,其中包括了对适应度函数的定义及膜规则的改进,从而寻找到等待处理的数据集的最佳聚类结果。并且本文利用三个标准测试函数对所提出新算法的性能进行了有效性验证;三、将TPDNA-GA算法与K-means相结合进行了相关研究与对比分析,并利用标准测试集进行了算法性能分析;最后本文将该TPDNA-GA算法的聚类过程应用在处理Web文档中,提出了具体的文档聚类应用过程,并且利用Reuters-21578中的数据进行实验,对聚类精确度进行验证和比较,证明该算法能够为人们在日常工作中查询文档提供方便。
其他文献
集装箱化提高了运输效率,促进了航运的专业化发展,对于全球供应网络的形成和运转具有重要作用。而中美两国,分别拥有世界最活跃和最早的集装箱港口体系,因此研究两国集装箱港口体
本文通过对大学校园CO2排放系统进行建模分析,获得了大学校园节能低碳的第一手数据及实现低碳目标可采取的具体措施。通过系统工程等分析方法对大学校园CO2排放系统减碳量化
学位
近年来,互联网和电子商务的飞速发展给人们的生活带来极大便利,同时也带来了信息过载问题。推荐系统利用兴趣相似用户对项目的观点为用户进行推荐,能有效解决信息过载问题。协同