论文部分内容阅读
机会发现(Chance Discovery)是一个新的研究课题。机会发现的主要研究内容是如何能从数据样本中发现对决策Agent具有重要作用的偶发的或隐藏的事件或情形。通过对目前机会发现算法研究的分析和归纳,本文从机会发现算法发现的机会事件出现在数据样本集和未出现在数据样本集的两个角度出发,分析了相应经典算法的优缺点,提出了一些新的思想和算法,同时对机会发现的形式化描述以及系统架构也作了相应的研究。本文主要从以下几个方面作了研究:(1)研究了机会的形式化描述方法。本文引入并拓展了模态逻辑,并基于模态逻辑给出了逻辑语言LDKa,利用LDKa对机会进行了形式化描述。为了更好的刻画机会的概念与特性,给出了逻辑语言LDKa的可判定性和可满足性算法证明过程,进一步说明逻辑语言LDKa的有效性。(2)研究了出现在给定数据集中的机会发现算法。主要是对出现在给定数据集中的,具有重要作用且出现频度小,但未被注意的那些事件或情形的发现。利用小世界网络理论指导算法优化,有效提升算法的精确度和性能。(3)研究了未出现在给定数据集中的隐藏机会发现算法。主要是对未出现在给定数据集中,同时与数据集中现有事件密切关联的具有重要作用的隐藏事件或情形的发现,这种事件或情形的发现能够更好地去理解和解释现有现象。引入加温退火法原理使得算法适用范围增大,同时提高了可解释的隐藏事件的比例。(4)研究了机会发现系统架构。将智能Agent技术引入了机会发现系统架构中,在保留了机会发现经典的双螺旋模型的优点的同时,为系统更好地实现提供了可行性方案,并可有效地提高系统的执行效率。本文以专利说明书应用领域为背景,建立专利文献的情形图模型,并分别去发现出现在样本集中和未出现在样本集中的候选机会,可将这种候选机会当作一种创业机会加以应用,从而验证了上述机会发现算法与架构的合理性、可行性及其优势。