Spark下的分布式粗糙集属性约简算法

来源 :计算机应用 | 被引量 : 3次 | 上传用户:lijinjie1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性约简(特征选择)作为数据预处理的重要环节,大多以属性依赖作为筛选属性子集的标准。设计了一种快速依赖计算方法 FDC,通过直接寻找基于相对正域的对象来计算依赖度,而不需要预先求出相对正域,相比传统方法在速度上有明显的性能提升。另外,改进鲸鱼优化算法(WOA)使其能够有效应用于粗糙集属性约简。结合上述两个方法,提出一种基于Spark的分布式粗糙集属性约简算法SP-WOFRST,并在两组人工合成的大数据集上与另一种基于Spark的粗糙集属性约简算法SP-RST进行对比实验。实验结果表明所提出的SP-W
其他文献
k步可达查询用于在给定的有向无环图(DAG)中回答两点之间是否存在长度不超过k的路径。针对现有方法的索引规模大、查询处理效率低的问题,提出一种基于部分点的双向最短路径索引来提升索引的可达信息覆盖率,并提出一组优化规则来减小索引规模;然后提出基于简化图的正反互逆拓扑索引来加速回答不可达查询;最后提出远距离优先的双向遍历策略来提高查询处理的效率。基于21个真实数据集(如引用网络、社交网络等)的实验结果
通过Hypermesh软件与STAR-CCM+软件对某长头车风窗玻璃进行分析,并给出相应速度参考指标。该指标可以间接快速评判除霜效果,从而快速评价风道设计性能优劣。对风道优化前后进
小区射频技术拉远是一项基站覆盖补充技术,它是一个新兴技术,具有系统容量可扩展及与系统匹配好等优点。详细分析了由于无线直放站反向干扰引起施主基站反向功率下降,大大降
目的探究经皮椎体成形术治疗骨质疏松骨折的临床效果。方法采用随机数表法将2015年4月至2016年4月兰考县中心医院收治的骨质疏松骨折患者108例随机分为对照组和观察组,每组54
为研究新型KZ31模块化垂直起升井架的动态性能,使用ANSYSWorkbench软件完成井架有限元模型的建立,并对井架进行模态与谐响应分析。模态分析确定井架振动特性的同时也是谐响应
为了解决多维数值型敏感属性数据隐私保护方法中存在的准标识符属性信息损失大,以及不能满足用户对数值型敏感属性重要性排序的个性化需求问题,提出一种基于聚类和加权多维桶分组(MSB)的个性化隐私保护方法。首先,根据准标识符的相似程度,将数据集划分成若干准标识符属性值相近的子集;然后,考虑到用户对敏感属性的敏感程度不同,将敏感程度和多维桶的桶容量用于计算加权选择度和构建加权多维桶;最后,依此对数据进行分组
目的分析吸入用糖皮质激素联合双水平气道正压通气(BiPAP)呼吸机对老年支气管哮喘合并Ⅱ型呼吸衰竭患者肺功能及动脉血气指标的影响。方法选择民权县人民医院2017年1月至2018