基于分布式计算模式的两种属性约简算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：wolantu

【摘要】

：

粗糙集是一种处理不确定、不完全理论的经典理论，属性约简是粗糙集理论的核心知识之一。为适应大数据的发展，对广泛应用于数据不确定性、不完备性处理的属性约简算法相应改进，提

【作者】

：

喻瑛杨峥王伟杰

【机构】

：

上海大学机电工程与自动化学院

【出处】

：

计算机技术与发展

【发表日期】

：

2018年1期

【关键词】

：

属性约简分布式大数据正域 all—to—all比较 attribute reduction distributed computing big dat

【基金项目】

：

上海市2015年度“科技创新行动计划”高新技术领域项目（15511109700）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

粗糙集是一种处理不确定、不完全理论的经典理论，属性约简是粗糙集理论的核心知识之一。为适应大数据的发展，对广泛应用于数据不确定性、不完备性处理的属性约简算法相应改进，提出两种适应分布式处理的属性约简算法。首先提出基于MapReduce框架和正域的属性约简算法；并借鉴Hadoop分布式处理机制，针对差别矩阵all—to—all比较特性，提出一种新型分布式处理机制，基于该机制提出了一种适应分布式数据处理机制的新型数据分割及分布规则，基于该规则探讨了基于差别矩阵的属性约简算法在新型分布式处理机制下的具体实现方法。

其他文献

基于功能结构元组的技术文档的特征提取研究

词汇模型在表征工程技术知识文档特征时,将文档切分为一个个相互不关联的词,较难提取出文档的语义特征。如果考虑到一条语句中词之间的关联性,根据工程技术知识文档的语义结

期刊

功能元组文本分类特征抽取算法设计function tupletext classificationfeature extractionalgori

基于多核集成学习的跨项目软件缺陷预测

软件缺陷预测的目的是通过历史缺陷数据预测新软件模块的缺陷倾向性,从而提高软件系统的质量。软件的缺陷模块存在结构复杂和类别分布不平衡的问题,并且历史数据是有限的。针

期刊

跨项目缺陷预测多核学习集成学习代价敏感学习有监督学习cross-project software defect predictionmultiple

基于互信息量和自回归模型的镜头分割方法

随着互联网的急速发展,盗版,不健康,暴力等视频在网络上肆意流窜,如何快速、有效、准确地对视频数据进行管理,已然成为迫切需要解决的问题。在视频处理过程中,首先是对镜头进行分割,然后再进行视频帧的分析处理。然而许多视频内容的复杂性比较高,不一定能得到比较好的分割结果。鉴于此,提出一种基于互信息量和自回归模型的自适应阈值镜头分割算法。该算法首先以非均匀分块加权HSV直方图为基础,通过计算两帧的互信息量求

期刊

镜头分割自适应阈值互信息量自回归模型lens segmentationadaptive thresholdmutual informationau

基于最小超球面密度的孤立点检测算法

定义了最小超球面密度的概念,提出了一种基于最小超球面密度的孤立点检测算法(minimum hyper sphere density,MHSD)。该算法根据数据的 k 近邻和反 k 近邻获得数据的有效近邻

期刊

孤立点检测最小超球面有效近邻局部密度差密度背离程度outlier detectionminimum hyper sphereeffective n

基于UPGMA的优化初始中心K-means算法研究

为了弥补传统K-means算法聚类效果严重依赖于初始聚类中心这一不足,提出了OICCK-means算法.将不加权算术平均组对法（UPGMA）进行改进,通过该算法将密集区域的数据合并得到可以反

期刊

聚类初始中心不加权算术平均组对法最大最小距离算法K-MEANS算法clusteringinitial centersUPGMAmaximum a

基于融合特征的群体行为识别

围绕群体行为的特征提取问题展开研究,提出了一种基于融合运动特征和外观特征的群体行为识别方法。为了更有效地描述识别信息,首先将各行人目标看成网络的节点,利用协方差跟踪获得目标的运动轨迹,同时利用格兰杰因果关系检验来衡量行人之间的相互作用;然后利用此因果关系来构建成双因果网络和成群因果网络,将其作为运动特征,并结合外观特征来描述群体行为。最后,采用改进萤火虫算法的支持向量机(SVM)进行群体行为识别。

期刊

群体行为识别特征融合GRANGER因果支持向量机group action recognition feature fusion Granger ca

城市路网上动态迁移的移动对象索引结构

移动对象索引技术是有效管理海量移动对象数据的支撑.目前的移动对象索引方法如FNR-tree、NDTR-tree等均采用基于磁盘的索引结构,忽略了移动对象在城市道路上密度分布不均衡

期刊

城市路网热点区域移动对象动态迁移索引技术

卷积网络的无监督特征提取对人脸识别的研究

目前基于卷积神经网络的学习方法需要大量的有标注的数据。而实际应用中,标记大量的数据是非常困难的。为了解决此问题,提出了一种基于卷积神经网络的无监督特征提取方法。该方法结合了局部保持投影(LPP)算法和卷积神经网络,LPP算法可以很好地保留图像局部结构。文中采用LPP算法来进行卷积核的学习。构建的网络结构简单有效,识别效率优于有监督的卷积神经网络。实验结果表明,该方法在真实条件下的人脸数据集Yale

期刊

无监督特征提取卷积神经网络局部保持投影人脸识别unsupervised feature extractionconvolutional neural

智能办公系统中基于模糊理论的联动呼叫技术

目前国网公司在处理语言通信业务时,其行政话机都是通过人工查询通信录,并以手工方式进行拨号通话,效率很低,给用户带来了很多的不便。针对上述情况,文中提出了一种面向智能

期刊

智能办公系统IMS桌面终端话机联动模糊理论intelligent office systemIMSdesktop terminaltelepho

基于2D图像变换的虚拟试衣算法

衣服与人体的精确匹配是虚拟试衣系统中的关键问题之一.与以往的3D模型匹配、2D图像匹配等方法不同,提出了一种新型的基于2D图像变换的更具有人体贴合性的虚拟试衣算法.算法

期刊

虚拟试衣KINECT2D图像变换算法virtual fittingKinect2Dimage transformationalgorithm

基于分布式计算模式的两种属性约简算法

与本文相关的学术论文