基于多重关系领域知识的分类问题研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:skdjflskdj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库规模的急剧增长要求数据挖掘能更有效地搜索与发现问题相关的数据,使发现的模式更有意义。现在的知识发现算法大多是“从零开始”的无需领域知识的独立发现,而在实际应用中,存储于用户大脑中或现有数据库中的领域知识在数据预处理、引导发现过程以提取更有意义的规则、解释发现结果等阶段都发挥着重要的作用。因此,在知识发现过程中融入领域知识已引起国内外学者的普遍关注,基于领域知识的知识发现已成为当前数据库中知识发现的一个重要的研究方向。 概念格是一种完备的知识表示模型,是数据分析和规则提取的有效工具。本文在对概念格及其扩展模型进行研究的基础上,提出基于概念格及其扩展模型表示领域知识,从多个概念层次上进行知识发现。本文的主要研究内容如下: 1.详细地讨论了领域知识的各种不同的知识表示模型,探讨了由不同知识表示模型表示的领域知识在知识发现过程各个阶段中的重要作用,展现了基于领域知识的知识发现的应用前景及所面临的挑战。 2.知识发现的实质是发现数据之间的潜在规律性,而这种潜在的规律往往是在不同的抽象层次上进行描述的,反映了不同粒度上的共性知识。然而,在知识发现中,数据库中存储的实际数据往往都只停留在某一粒度层次,有的数据所处的层次较低,难以从宏观的角度反映数据的规律;有的数据所处的层次较高,隐藏了一些细节上的共性知识。为此,本文提出对目标数据集引入多重关系领域知识,通过对细粒度信息进行泛化、对粗粒度信息进行展开发现数据之间紧凑的描述信息。 3.基于概念格这种完备的概念层次模型表示多重关系领域知识,将多重关系领域知识用于知识发现中分类问题的求解,设计了一种基于多重关系领域知识的分类算法CS_MRDK,通过实验验证了该算法能发现隐藏在数据内部的共性信息,有效地提高发现知识的质量。 4.在上述研究工作的基础上,实现了基于多重关系领域知识的分类知识发现原型系统。
其他文献
以计算机为核心的现代教育技术的迅速发展,现代教育手段的充分利用,教学仪器的逐步智能化,将改进教学方法,提高教学效益和教学质量,并使实验室管理提高到一个新的水平。系统设计的
本文首先在研究面向对象软件开发与测试的现状以及组件测试的现状的基础上,指出了传统的测试技术已无法对面向对象软件进行有效的测试,分析了J2EE组件与容器交互的特点,提出了J2
计算机化自适应测试的基本思想就是使用计算机去选择最适合特定受测者测试的项目,然后通过受测者的反应来估算受测者的能力值。这种能力的估算允许我们与其它回答不同测试项目
随着数据仓库技术的发展,很多电信企业都已经成功实施了数据仓库系统。电信企业的数据仓库系统已经成为企业进行决策分析的重要工具,电信企业内部的其它系统甚至电信企业外部系
随着计算机网络的发展和信息化的推进,数据越来越成为宝贵资源,各行业逐渐使用面向数据的新系统,数据平台的建设和完善已变得十分重要。对于民航领域,由于数据量大、质量要求
随着计算机技术的发展,仿真加工技术在很多重要产品的开发过程中得到成功应用,它对于节约成本,减短开发周期,提高产品质量,减少损失具有重要的现实意义。齿轮切齿仿真加工系统可以
随着各组织机构规模的不断扩大,分支机构不断扩展,电子商务、电子政务的广泛普及,机构和组织内外信息传递越来越多,而网络安全问题却越来越严重,如何用最低的费用来保障通讯的高效
异步传输模式(ATM)作为宽带综合业务数字网的重要实现技术,越来越受重视。在ATM网络中,信息的拥塞及丢失是影响网络业务服务质量的主要原因。自适应比特速率(ABR)业务是ATM服务
智能视频监控是计算机视觉领域一个备受关注的课题,在安防监控、智能交通、人机交互和智能导航等领域有广泛地应用前景。  运动目标检测算法主要包括背景建模和目标提取两个
移动自组网是一种有广阔应用前景的新型网络技术,在理论研究和产业应用领域都引起了人们的广泛关注。但它的动态拓扑特性导致传输路径频繁断裂,引发大量的重路由操作,极大地降低