论文部分内容阅读
海量规则并行处理是一个新兴研究课题,它涉及语义计算、规则处理、数据库、模式识别、人工智能、数据挖掘、模式识别、知识发现、并行计算、图论以及数据结构等多个学科,给目前信息科学和技术领域的研究带来了巨大的挑战。该技术的研究突破可以解决海量规则的有效、即时处理问题,并具有非常广阔的应用前景。规则描述模型、海量规则网优化理论与海量规则网的有效划分是海量规则并行处理研究的最核心的重难点问题,其研究受到了国内外学者越来越多的关注。本文对海量规则并行处理的几个关键性技术进行了研究,其内容主要包括以下几个方面:(1)规则描述模型本文研究了一种可以表示各种粒度(大粒度、中粒度以及小粒度)规则的规则描述模型。主要包括规则节点表示方法、规则节点流量以及规则节点可计算代价等。(2)海量规则网及其优化方法本文研究了基于规则合并及其基于规则模块等价替换的海量规则网优化方法。论文通过研究规则,将不同规则中有重复规则节点的进行合并,达到规则完全合并或者部分合并目的;同时,论文通过那些计算功能等价的规则模块,将计算代价小的规则模块替换掉计算代价大的规则模块。(3)海量规则模式匹配处理模型以及运行时处理算法本文在分析现有的各种规则模式匹配处理算法的基础上,针对现有规则模式匹配处理算法的缺陷,提出了一种适合于海量规则的海量规则模式匹配处理模型以及运行时处理算法。(4)海量规则网并行处理机制本文提出并研究了一种海量规则并行处理机制GAPCM。研究了将海量规则生成互相独立的规则子网方法;研究了任务预分配方法;研究了规则子网的合理划分方法;研究了规则子网内部通信以及处理机之间的外部通信;最后研究了将任务具体映射到所对应处理机的方法。(5)海量规则网分割算法针对海量规则的并行处理,研究了海量规则子网的分割问题,本文设计了:1)规则子网平衡分割算法,该算法考虑处理机处理代价平衡分布,不考虑处理机等待(依赖)消耗也不考虑处理机通信消耗问题;2)规则子网平衡最小依赖分割算法,该算法考虑处理机处理代价平衡分布,考虑处理机等待(依赖)消耗,但是不考虑处理机通信消耗问题;3)规则子网平衡最小依赖与通信分割算法,该算法考虑处理机处理代价平衡分布,考虑处理机等待(依赖)消耗,同时也在考虑处理机等待消耗基础上考虑处理机通信消耗。