基于统计相关系数的数据离散化方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:very_god
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
很多数据挖掘方法只能处理离散值的属性,因此,连续属性必须进行离散化。提出一种统计相关系数的数据离散化方法,基于统计相关理论有效地捕获了类属性间的相互依赖,选取最佳断点。此外,将变精度粗糙集(VPRS)模型纳入离散化中,有效地控制数据的信息丢失。将所提方法在乳腺癌症诊断以及其他领域数据上进行了应用,实验结果表明,该方法显著地提高了See5决策树的分类学习精度。
其他文献
为解决表达式重排序等算法存在的程序运行速度、隐藏信息量等问题,研究与实现了基于表达式逆序数的软件水印算法。算法通过排列的逆序数和二进制数的一一对应关系得到映射字典,再根据映射字典完成水印数据的编码、嵌入和提取。仿真结果表明,该算法对提高程序的运行速度和隐藏水印的数据率有明显的效果,性能优于表达式重排序等算法。
为了解决三相四线制电网中谐波、无功功率和三相不平衡等电能质量问题,本文采用基于DSP+CPLD全数字控制的并联型有源电力滤波器(APF)来实现补偿。介绍了APF的系统结构及工作原理,
针对相交特征自动识别较为困难的问题,提出一种新的三维实体模型相交特征识别方法。首先以属性连接图(AAG)表示简单特征的拓扑结构,以几何关系约束图(GRRG)描述简单特征组成面的几何约束关系;然后在子图匹配基础上,先识别实体模型中拓扑结构未发生变化的简单特征,修补后将其移出实体模型,再通过添加镜面操作进一步识别拓扑结构发生改变的简单特征。在此基础上,将相交特征表示为一组相连的简单特征实体,从而实现相
大多数乐谱识别工作都是在MIDI格式文件下进行的,而音乐数据大多采用音频格式存储,为此讨论一种从WAV音频文件的独奏乐曲信号中识别出乐谱的方法。采用离散余弦变换(DCT)结合能量比对的手段,并提出了一种变化音最少法则:以十六分音符对应的时值作为步长,将乐曲信号分为若干个子段;对每个子段进行一维DCT操作,提取基音频率;对相邻子段进行能量比对,查找音符的端点;利用变化音最少法则,生成乐谱。实验表明此
针对现有的直觉模糊聚类算法性能的问题,提出一种基于核的直觉模糊聚类算法(IFKCM)。该算法引入高斯核函数,将直觉模糊集合从原始观察空间映射到高维特征空间,减少了计算时间且提高了聚类精度;同时改进了现有的直觉模糊聚类算法中的概率型约束条件,使其对噪声和野值点具有较好的鲁棒性。最后,通过实际数据和人工数据与常用聚类算法进行了对比实验,结果表明该算法较大幅度地提高了直觉模糊聚类算法的性能。
本文在构建多重框架的基础上,以资源化枯竭的乌海市为研究对象,研究其转型路径。首先介绍了作为呼-包-鄂-银经济带上重要节点的乌海市所处的地理位置,以及乌海市产业结构发展