论文部分内容阅读
规则引擎作为人工智能领域中一种经典的知识表示和推理方法,在学术界和工业界得到了广泛的研究和使用。近年来云大数据的流行为规则引擎提供了更为广阔的应用空间,但同时也带来了严峻挑战。当问题规模变大时,规则引擎快速降低的计算效率使其很难处理好大规模的数据。虽然一直以来有很多的研究工作试图提高规则引擎处理大规模数据的能力,但都有各自的问题,包括提升效果并不理想、实现方法受限不具有一般性等。在借鉴前人研究的基础上,结合对并行和分布式计算模型的学习和研究,本文提出了一种新的基于消息传递模型的分布式规则引擎实现方法,试图使其能利用多机计算集群并行分布式地处理好大规模数据,高效地进行海量知识的表示和推理。本文首先介绍了系统的设计,包括如何将规则引擎的核心概念映射到消息传递模型,如何统一和协调分布式规则引擎各节点的运行,如何在分布式环境下给各节点分配数据包括知识。接着在说明了被发现于所实现原型系统中的性能问题之后,我们提出了相应的解决方法,包括引入更高效的算法等。然后我们描述了系统的一些实现细节,包括整体的架构,模块的划分、功能和主要API等。最后,我们介绍了进行的性能测试实验并讨论了实验结果,验证了我们所实现的系统处理大规模数据的性能可以通过并行和分布式计算获得显著的提升。