论文部分内容阅读
模式匹配是指确定不同模式元素之间语义上的对应关系的过程,是识别、消除语义异构性的一种有效手段。目前,大多数的模式匹配系统都集成了多种不同的匹配组件,这种多组件的模式匹配系统一方面具有良好的可扩展性和通用性,另一方面也为用户的使用带来了一定的困难:对于给定的匹配问题,用户难以确定如何设定系统配置才能获得最佳的匹配结果。本文首先对模式匹配和模式匹配系统优化调整问题的相关研究进行了综述,分析了现有方法的特点和不足。在此基础上,本文设计并实现了一种基于遗传算法的模式匹配系统优化调整方法GATuner。GATuner能够根据输入的模式自动地生成训练数据集,使用遗传算法找出模式匹配系统的最佳配置。本文还利用基于CUDA的细粒度并行遗传算法对GATuner进行了优化改进,提高了求解效率。实验表明,GATuner能够针对不同的问题对模式匹配系统进行优化调整,有效地改善匹配结果的质量,减少用户的工作量。与其他方法相比,本文提出的方法主要具有以下特点:1、GATuner能够根据输入的模式自动地生成训练数据集。目前,GATuner适用于XML模式和关系数据库模式的匹配问题,通过定义专门的转换规则,还可以扩展到其他类型的匹配问题。2、GATuner使用遗传算法搜索模式匹配系统的最优配置,与其他方法相比,更加能够保证所求解的全局最优性。3、GATuner通过并行的遗传算法提高了求解效率,由于采用一般的GPU设备代替并行机、集群等并行环境,本文的方法更加经济可行。本文的研究工作使用户能够更加方便有效地利用各种模式匹配系统解决实际应用中的问题,具有较好的实用价值。本文还对将GPU通用计算应用于模式匹配领域进行了尝试和探索,对其他的相关研究具有一定的参考价值。