混合型数据的代价敏感学习方法

来源 :闽南师范大学 | 被引量 : 0次 | 上传用户:xiaoyao984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的广泛应用,人类社会产生数据的速度急剧增加,大量有用信息被隐藏在海量数据中。数据挖掘则是人们提取这些信息,进而获得知识的重要技术。从大量的现实数据中挖掘隐藏在其中有用信息的过程即为数据挖掘。事实上,它们已经被成功应用到科学研究、工程、银行和医疗等各个行业,并且正在发挥着越来越重要的作用。粗糙集理论(Rough set theory)作为一种处理不确定信息的新型数学工具由Pawlak于1982年提出。粗糙集理论吸引了世界范围内许多研究者和实践者的关注。近年来,粗糙集理论及实际应用都取得了长足的发展。粗糙集理论已被成功地应用于很多领域,尤其是在机器学习和数据挖掘。目前经典粗糙集已成功处理符号型的数据,邻域粗糙集成功处理数值型的数据。同时还产生了覆盖粗糙集、决策粗糙集等诸多理论分支并成为粒计算三大理论之一。代价敏感学习是数据挖掘中十大具有挑战性问题之一。代价是在数据获取或数据处理的过程中产生的,是数据不可分割的一部分。测试代价是在进行测试时获得每条测试的属性值所付出的价值。误分类代价即为把属于一类的记录划分为另一类时需要支付的代价。代价敏感学习通过权衡测试代价和误分类代价,使得所采取的行为的代价最小或产生最优决策行为。在数据挖掘和机器学习领域,代价敏感学习既是热点问题,也是难点问题。在现实应用中,所需处理的数据多为混合了符号型数据和数值型数据的混合型数据。已有的方法在处理混合型数据的代价敏感属性选择问题时,常将不同类型的数据处理成一种类型的数据。例如,将混合型数据中的符号型数据归一化为数值型数据或将数值型的数据离散化成符号型数据。但是,这样处理混合型数据会造成数据本身信息丢失,导致属性选择的测试代价和误分类代价增加。因此,研究混合型数据的代价敏感学习无论就知识发现的理论研究,还是许多领域的应用需求都具有重要的价值。本文主要研究数据值域为混合型数据的代价敏感学习。本文的研究内容主要分为两部分:第一部分详细研究了混合型数据的测试代价敏感属性约简问题。一方面,我们提出一个改进的人工蜂群算法来解决符号型数据上的测试代价敏感属性约简问题。实验结果表明,我们所改进的算法的实验结果在很大程度上比已有的算法优越。另一方面,我们提出自适应邻域和基于自适应邻域的算法解决混合型数据上的测试代价敏感属性约简问题。实验结果表明,我们所改进的算法的实验结果在很大程度上比已有的算法优越。第二部分主要研究了混合型数据的代价敏感属性选择问题。代价敏感属性选择问题是考虑测试代价和误分类代价属性选择问题。基于自适应邻域模型,我们提出基于自适应代价属性选择算法解决混合型数据集的代价敏感属性选择问题。实验结果表明,我们所改进的算法的实验结果在很大程度上比已有的算法优越。
其他文献
学位
大偏差理论是概率论的极限理论中极富成果的一个分支,它处理和中心极限定理不同的另一类极限问题,是大数定律的精密化.在数理统计、分析和物理中都有重要的应用,它的理论溯源于K
差分方程是对客观世界中事物发展演化的数学描述之一.在许多情况下,尤其是当今计算机科学和技术迅速发展的推动下,关于时间变元的采样和测量往往是离散的.因此,差分方程成为一些学
小波变换是一个时间和频率的局域变换,能有效的从信号中提取信息,在图像压缩,图像去噪,图像融合、模式识别等众多领域中获得了广泛的应用。但是小波分析作为一种线性信号的分
自从E.C.Posner提出了素环上的导子和中心化子的问题并给出了著名的Pos-ner定理以来,人们在素环、半素环以及其理想、Lie理想等子集上用不同的方法推广和完善了导子和中心化子
素理想回避引理是交换代数的一个简单而又非常有用的引理,它可以叙述如下:设R是交换环,P1,P2,…,Ps是环R的素理想,I,J是环R的理想。如果I(≤)J,I(≤)P1,I(≤)P2,…,I(≤)Ps,则存
图的嵌入问题是衡量一个互连网络的中心问题之一,它的重要性在于我们可以将关于客图的已有算法应用到主图中.环和线性阵列由于通信成本低廉,因而是并行处理和分布计算中的两个基
针对信息时代智能手机等移动通讯设施成为了人们手足般不可缺少之工具,充分遵循了学习者认知规律及学习心理的变化,采用了移动通讯设施进行“建筑装饰材料”课程考核的改革尝
伴随当前教育教学改革的持续深入,怎样优化、改进、完善教学方法,是培养综合实用型医学人才,最快、最好达成教学目标的关键所在.
新疆焉耆县是“花儿”的故乡,“花儿”文化源远流长.多年来,焉耆县认真开展新疆“花儿”的传承保护工作,通过多方面的努力,“花儿”这种具有浓郁特色的民族民间艺术,被更多的