论文部分内容阅读
粗糙集理论是一种处理含糊和不确定性问题的新型数据分析方法,以其为理论基础的数据处理技术得到深刻关注和不断发展。信息检索致力于寻求准确、高效、智能的信息组织与存取方法,成为当今智能信息处理领域的重要研究内容。本文基于粗糙集理论,针对信息检索模型和信息处理技术涉及的几个关键问题进行了较为深入的研究和探索。比较分析传统信息检索模型与标准粗糙集信息检索模型,将条件概率相似关系结合粗糙集理论引入信息检索,构造概率粗糙集信息检索模型,有效地解决了标准粗糙集信息检索模型中如何设计分类方法,以及体现类间关系的难题。在标引词空间定义条件概率关系,反映了标引空间的模糊相似性,不仅能充分挖掘和利用标引词间相似关系,而且可调节支持度阈值获得理想检索效果。深入研究规则获取过程的本质,分析已有规则获取方法存在的问题,将分布约简应用于规则归纳系统,定义规则的分布核与分布约简概念,提出一种基于分布约简构造规则知识库的增量式学习方法。采用启发式算法获取决策信息系统规则集,当新对象加入时在原有规则知识库基础上进行增量式更新,避免了为更新规则而重新运行规则获取算法。该方法能适应决策信息系统的不一致情形,且运用此方法所得规则集能够保持与原信息系统一致。