信息分发管理中基于粗糙集分类模型的数据挖掘

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:guomingjie000111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于网格的信息分发系统中,需要处理海量信息,不仅信息量大属性缺失的数据也常见。若不能进行正确处理,就会产生信息淹没与数据垃圾,无法获取信息优势。本文研究的基于粗糙集的分类模型正是针对这个问题而提出。分类模型是信息分发系统中的一个重要组成部分,其主要目标是保证将有效信息分类并分发给真正需要它的用户。 分类模型的关键部分是用户需求发现,它通过对用户历史访问信息的行为进行学习,找出不同用户对不同类型信息的潜在兴趣。实质上,用户需求发现可归属于分类知识发现的范畴。分类知识发现将通过对反映用户历史访问行为的用户信息需求进行分类预测分析,把用户信息需求分为有无需求两大类。分类知识发现模型可由不同的分类知识发现技术来构建。但是,有的分类知识发现技术建立的模型要么比较复杂,要么需要一定的先验知识——这种方式具有主观性。粗糙集作为一种有效的数据分析工具,与其它知识挖掘技术相比,在解决分类问题上有独到的优势,在较少的数据中也可挖掘出较好的规则或知识,生成的规则易于理解,而且该方法简单、易于操作。 鉴于上述分析,本文对基于粗糙集的分类知识发现进行了研究。重点研究了基于粗糙集的分类知识发现模型中的重要部分——属性约简、分类规则约简、分类预测以及在属性缺失条件下的分类算法。属性约简方面,结合属性约简的基本概念,提出了求绝对核的算法,改进了属性约简算法,此算法提高了计算效率。在规则约简方面,重新定义了核值,使之适用于不一致决策表,以此为基础,提出了既适合一致决策表又适合不一致决策表的分类规则约简算法。在分类预测方面,将基于相似度的分类预测方法应用于无规则匹配的情况。在属性缺失的条件下,对每个条件属性的重要度进行了定义,给出了不影响整个系统时间复杂度的缺值分类算法。 本文还对上述所提算法在信息分发系统中的应用进行了研究。一方面,在信息分发系统总体结构的基础上,对信息分类功能进行了分析和设计。另一方面,研究了基于粗糙集的分类模型在信息分发中的应用,实现了用户需求发现。
其他文献
目前,道路交通安全评估主要通过对交通事故进行分析来完成的,该方法无法对未建成的道路进行安全评估,并且用于分析的事故数据的采集有相当难度。本课题的主要研究内容是在分
医疗诊断是一种用于临床发现或对患者基于表现出的病症进行探究的医疗方法。目前,对于疟疾的诊断有很多种方法,为了确认影响病人的感染类型,其中的一种方法是通过访问一个健康机
地球物理勘探,简称物探,是研究地质构造和解决找矿勘探问题的基本方法之一。它以各种岩石和矿石的密度、磁性、电性、弹性、放射性等物理性质的差异为研究基础。其中,重力勘
随着新的网络协议标准的不断提出和高速的网络应用的不断出现,特别是在网络吞吐量要求比较高的场合,传统的TCP/IP协议栈架构的层次结构已经不能很好地满足人们的需求。但另一
近年来,随着嵌入式计算和控制技术的不断发展,嵌入式系统的应用越来越广泛,从日常生活到工业领域,可以说是无处不在。VxWorks操作系统是一种可以运行在目标机上的高性能、可
随着计算机技术的快速发展及影像医学在临床诊断中的成功应用,计算机辅助诊断技术日益发展。脑血管瘤在临床上还是通过医生观察血管造影图像进行诊断的,其缺点是准确性和客观
人脸研究一直是计算机视觉、模式识别和计算机图形学领域中的热点研究问题之一。目前,通过监视器得到的人脸图像分辨率不高,以至于给人脸识别和跟踪等后续应用带来很大的困难
人脸表情识别是利用计算机技术,将人脸表情特征与预先从图像库中提取的特征进行综合比较,以达到人脸表情识别的技术。该技术在模式识别、智能控制等领域都有着很高的社会价值
在PC机和普适计算盛行的今天,嵌入式系统的应用已经成为计算机工业最热门的领域之一,16位/32位高端MCU由于具有功能强大、处理速度快、能耗低等优点,逐渐成为研究与开发的热
移动自组网(Mobile Ad-hoc NETworks,MANETs)是一种没有基础设施支持的无线网络,具有多跳、无中心、自组织、可移动等特点,使得移动自组网组网方便、快捷,不受时间和空间限制