论文部分内容阅读
知识发现自提出以后,一直是学术界和应用领域关注的焦点,但面对着如今日益复杂的领域应用环境,现有的研究方法多基于统计学习,常常忽略了领域知识间的关系以及领域知识随着时间的变化,在应用效果方面往往差强人意。如何准确把握领域知识间的统计关系,进行正确的领域知识学习与领域知识更新,成为领域知识研究的一个难点。近几年,随着统计关系学习研究的兴起,结合概率图模型和一阶逻辑理论的马尔科夫逻辑网为研究者们所提出,并成功的应用于自然语言处理、机器学习、社会关系分析等领域中。在这种背景下,本文采用马尔科夫逻辑网,结合领域分类数据集,构建了领域知识库,进行了其在领域知识学习与更新技术中的探索研究。本文的具体研究内容及研究成果如下:(1)本文首先介绍了传统方法中的SVM进行本文的领域知识分类学习,然后提出一种基于马尔科夫逻辑网的领域知识学习技术。该技术在传统方法的基础上,引入了一阶逻辑来表示领域知识间的关系,使得领域知识的学习效果更佳突出。本文设置了两组实验进行了对比,最终发现基于马尔科夫逻辑网的领域分类知识学习效果要平均高于另一种5~6个百分点。(2)在领域知识更新方面,面对本文的领域任务——文本分类,结合传统的3种知识更新策略,提出基于特征词库增量学习的领域知识更新技术,并进行了3种策略的对比实验与分析,验证了其有效性与可行性。(3)针对传统方法在进行领域知识更新时的不足——没有考虑领域知识间的关系,延伸马尔科夫逻辑网在领域知识学习中的应用,并结合增量式知识学习策略,提出基于马尔科夫逻辑网的领域知识更新技术。该方法在通过马尔科夫逻辑网在领域知识学习步骤中获得知识后,将新知识加入原有知识重新学习,然后更新领域知识库。实验结果表明,采用该技术的领域知识库在进行分类决策时提高了2~3个百分点的准确度。基于以上的研究可知,马尔科夫逻辑网统一了概率图模型和一阶逻辑,能够很好的处理领域信息的统计关系,在领域知识的学习和更新方面有着很好的效果,具有广泛的研究前景。