基于决策熵的知识约简方法的研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:jinwei001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速地从海量数据中智能地挖掘出有价值的知识,一直是人类所迫切追求的,但由于知识发现技术中传统的数据挖掘方法不能很好的处理不完整、不确定信息,从而限制了其在工业上的应用。由于粗糙集方法能有效地处理不确定、模糊型信息,并且不需要提供先验知识,故受到了科研学者以及工业界人士的关注和喜爱。近年来,已被成功应用于人工智能、模式识别、机器学习等领域中。   知识约简方法是粗糙集理论研究的核心内容之一。其中,知识约简包括属性约简以及值约简,目前,许多研究人员主要把精力放在了对属性约简算法的提出和改进上,对值约简算法的研究相对较少。本文分析已有值约简算法发现,目前的值约简算法要么识别率不高,要么时间复杂度较高,而且也不能客观地反映决策规则的决策能力的变化情况。为了尽量解决这一问题,文中利用置信度以及决策熵能客观反映决策规则的决策能力的变化情况的优势,提出了一种基于决策熵的值约简算法。本算法主要是采用等价划分以及容差关系在属性空间上对决策表分解,再根据置信度和决策熵判断每条决策规则中属性值是否该删除,从而得到了最终的规则集,并通过实例分析详细地阐述了算法的思想。   本文仿真实验平台是基于重庆邮电大学计算机科学与技术研究所开发的RIDAS系统,通过对本算法的仿真实验,可知算法最终结果在正确识别率上接近已有规则获取算法的识别率,并且运行时间较低。以及与启发式值约简算法和基于决策矩阵的值约简算法的对比实验,可以验证本文算法是一种可行的值约简方法,接着,对Pima数据集得到的部分决策规则集进行实际意义的分析。但是由于本算法有大量的论域划分以及熵的计算,时间复杂度还有待降低,所以,接下来主要把精力放在怎么样进一步的降低时间复杂度,得到高效率的决策规则集。
其他文献
随着计算机领域的不断发展,计算机安全方面已经出现很严峻的挑战,特别是在信息安全方面。在计算机安全发展的过程中,入侵检测的地位呈现出越来越重要的趋势,入侵检测的研究也
功能成像是当前核医学和医学影像学研究的一个热点领域,它结合计算机图形图像学、计算机影像处理与分析、虚拟现实和计算机网络等研究领域,主要研究生物体的生理功能,目标是显示
移动定位技术的广泛使用促进了基于位置的服务(LBS)的迅猛发展,人们已经充分地认识到个人位置隐私保护的重要性,基于位置的数据隐私保护逐渐成为研究热点。匿名位置信息可能
近年来,随着互联网技术的飞速发展,各种高速、大容量的实时流数据处理已遍布各种应用领域,如网络监控、金融分析、网络入侵检测、传感网络、Web日志以及点击流等,这些应用领域产
随着计算机技术、网络技术的发展,庞大而复杂的应用程序对网络性能提出了更高的要求,决定网络性能的主要因素是网络设备的功能及性能。高性能网络设备的核心是高速网络芯片,目前
取材于风靡全球的益智玩具魔方,针对当前电脑游戏软件领域以魔方为题材的产品较少的现状,使用3D程序开发技术,设计并实现一款三维界面的虚拟魔方游戏软件。三维魔方游戏软件
作为密码体系安全手段的重要补充,信任管理在解决P2P网络内部攻击,识别恶意节点,提高系统安全性、可靠性和公平性方面有着显著优势。本文在分析已有的信任评估模型基础上,分别针
IP语音通信技术是一种综合使用多种技术的新型通信技术,它能够充分利用互联网络高带宽、低费用的优点,为人们带来便利的通信服务的同时,最大程度的节省通信费用。目前,无线IP语音
SaaS模式是面向多租户提供服务,租户共享相同的代码实例,可以根据自己的实际需要自定义界面、字段、流程等。如何通过一个可配置的引擎,在保持原有的代码实例不变的前提下,能
粗糙集理论是信息不确定性度量研究的重要理论工具,其特点是能直接从给定问题的描述集合出发,不需要先验知识和外界信息,通过知识对象的不可分辨关系给定问题的近似域,找出该问题