基于VPRS多变量决策树优化算法

来源 :计算机系统应用 | 被引量 : 1次 | 上传用户:clj7724383
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
噪声数据降低了多变量决策树的生成效率和模型质量,目前主要采用针对叶节点的剪枝策略来消除噪声数据的影响,而对决策树生成过程中的噪声干扰问题却没有给予关注。为改变这种状况,将基本粗糙集(rough set,RS)理论中相对核的概念推广到变精度粗糙集(variable precision rough set,VPRS)理论中,并利用其进行决策树初始变量选择;将两个等价关系相对泛化的概念推广为两个等价关系多数包含情况下的相对泛化,并利用其进行决策树初始属性检验;进而给出一种能够有效消除噪声数据干扰的多变量决
其他文献
首先,选择合适的文本集合,并且对文本进行分词处理,然后,进行文档内部特征词的提取,通过采用词频统计的方法对文本向量进行降维处理,从而选择最佳的特征向量。最后,将非数值
逐字分词法是以汉语词典为基础对中文语句通过匹配进行切分的方法。该方法在分词中无法解决交叉歧义与组合歧义带来的问题。本文以词典分词为基础,从序列标注的角度,在逐字匹
缺少文档的开源项目和文档不完整的开源项目,分析其源代码是了解其运行机理的主要方法,本文提出一种基于函数分析顺序的分析方法,并且提出构建函数分析顺序的过程。过程为首先使
将自组织映射SOM(Self Organization Map)聚类算法应用于电信客户细分,并与采用K-means聚类算法得到的结果进行比较。实验表明,SOM可以有效的进行电信客户细分且聚类效果较优,
文章对目前网络中IP组播流媒体存在组播孤岛和不同接入带宽用户群组播数据不能共享等问题,提出了一种新的流媒体融合组播覆盖网络,研究通过P2P互联不同IP组播区,实现组播数据共
动态克隆选择算法应用于入侵检测的过程中,经过记忆检测器和成熟检测器检测后的剩余抗原被直接作为自体供未成熟检测器耐受,但这些剩余抗原并非完全是自体,有可能隐含新型攻击。
针对多个ORACLE数据库系统的主动性监控问题,提出一个基于CACTI的分布式监控报警系统。采用"一个管理端+多个代理"的监控模式,CACTI作为监控管理端,在运行ORACLE数据库服务器上
随着视频和互联网技术的发展,视频信息的存储安全问题越来越紧迫。本文针对新一代国际视频压缩编码标准H。264的编码特点,提出一种将流密码与H.264熵编码相结合的视频加密算法,通
在分析模式匹配算法的基础上,提出了一种改进的模式匹配算法,并将该算法应用于大规模数据分析软件设计之中。在数据分析的初始阶段,通过该模式匹配算法建立一张数据索引表,随后分
在随着水利企业信息化的逐步深入,企业内部之间存在着大量异构信息的交互和共享,开放性和集成性成了企业信息化的重要发展方向。本文就结合飞来峡水利枢纽数据集成系统的实际开