论文部分内容阅读
生物计算是计算科学和生命科学的交叉研究领域。膜计算是生物计算的分支,其计算模型统称为膜系统(P系统),具有分布式与极大并行性及容错性强的优点。对于数据进行聚类是数据挖掘与知识发现的重要组成部分,聚类有多种方法,这些方法各有自己的优势与不足,分别在不同的应用领域中取得理想的聚类效果。随着信息时代的到来,聚类分析面临的数据量陡然增加,数据类型纷繁复杂,经典聚类算法已经不能满足当今日益变化的数据分析需要,聚类算法的优化研究成为领域内的研究热点。论文提出两个基于高效聚类优化算法的细胞型P系统,解决复杂聚类问题;将两个P系统应用于数据挖掘领域与图像分割领域,主要工作如下:(1)介绍了本研究涉及的膜计算与聚类优化算法的研究背景和研究现状,膜计算及聚类领域的现有基本的理论与方法,膜计算的研究对象、结构、规则以及现存的计算框架,现在广泛应用的几大类聚类算法,以及目前对于聚类算法的一些改进及本研究的创新点与难点。(2)提出了两个核心算法,第二章提出了一个基于GD-K-medoids聚类算法的细胞型P系统。该新算法结合了网格聚类,密度聚类以及划分聚类中K-medoids算法的优点,并设计了全新的膜结构与膜规则实现该算法。将基于GD-K-medoids聚类算法的细胞型P系统与经典聚类算法做实际数据集上的比较分析,证明P系统在算法时间复杂度和准确度等方面具有一定优势。第三章提出了一个基于细胞型P系统的MDE-K-means聚类算法,从膜计算与聚类算法结合的新角度出发实现算法。本章将改进之后的算法与原始算法在人工数据集上进行聚类,对几种算法做类间分离度,类内紧密度比较分析,证明了提出的膜系统的有效性。(3)将本研究提出的基于膜系统的GD-K-medoids聚类算法应用于澳门游客消费能力分析中,数据为澳门旅游局提供的官方数据与问卷,提取其中与消费能力相关的属性,并对数据进行清洗,最后获得3577个有效数据,将数据分为六类后,对实验结果进行评价与分析,根据不同类别游客具有不同的年龄、性别、收入、行为特征等,其在不同方面的花费也差别较大。通过本章的实验与分析获得更有价值的知识发现,为澳门旅游局提供营销策略参考。(4)将提出的基于MDE-K-means算法的膜系统应用于图像分割中,从分割清晰度,迭代次数,迭代时间上进行分割比较,验证算法的有效性。多次实验后结果表明,本文提出的膜系统应用于图像分割中相比经典K-means算法及FCM聚类算法,具有较好的分割效果。第六章为总结与展望,梳理研究涉及的全部内容。本研究为聚类问题的解决提供了新的方法,为膜计算的应用提供了新思路。同时在第六章总结了本研究还存在的一些不足,明确了进一步的研究方向。