基于分布式计算模式的两种属性约简算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:wolantu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集是一种处理不确定、不完全理论的经典理论,属性约简是粗糙集理论的核心知识之一。为适应大数据的发展,对广泛应用于数据不确定性、不完备性处理的属性约简算法相应改进,提出两种适应分布式处理的属性约简算法。首先提出基于MapReduce框架和正域的属性约简算法;并借鉴Hadoop分布式处理机制,针对差别矩阵all—to—all比较特性,提出一种新型分布式处理机制,基于该机制提出了一种适应分布式数据处理机制的新型数据分割及分布规则,基于该规则探讨了基于差别矩阵的属性约简算法在新型分布式处理机制下的具体实现方法。
其他文献
词汇模型在表征工程技术知识文档特征时,将文档切分为一个个相互不关联的词,较难提取出文档的语义特征。如果考虑到一条语句中词之间的关联性,根据工程技术知识文档的语义结
软件缺陷预测的目的是通过历史缺陷数据预测新软件模块的缺陷倾向性,从而提高软件系统的质量。软件的缺陷模块存在结构复杂和类别分布不平衡的问题,并且历史数据是有限的。针
随着互联网的急速发展,盗版,不健康,暴力等视频在网络上肆意流窜,如何快速、有效、准确地对视频数据进行管理,已然成为迫切需要解决的问题。在视频处理过程中,首先是对镜头进行分割,然后再进行视频帧的分析处理。然而许多视频内容的复杂性比较高,不一定能得到比较好的分割结果。鉴于此,提出一种基于互信息量和自回归模型的自适应阈值镜头分割算法。该算法首先以非均匀分块加权HSV直方图为基础,通过计算两帧的互信息量求
定义了最小超球面密度的概念,提出了一种基于最小超球面密度的孤立点检测算法(minimum hyper sphere density,MHSD)。该算法根据数据的 k 近邻和反 k 近邻获得数据的有效近邻
为了弥补传统K-means算法聚类效果严重依赖于初始聚类中心这一不足,提出了OICCK-means算法.将不加权算术平均组对法(UPGMA)进行改进,通过该算法将密集区域的数据合并得到可以反
围绕群体行为的特征提取问题展开研究,提出了一种基于融合运动特征和外观特征的群体行为识别方法。为了更有效地描述识别信息,首先将各行人目标看成网络的节点,利用协方差跟踪获得目标的运动轨迹,同时利用格兰杰因果关系检验来衡量行人之间的相互作用;然后利用此因果关系来构建成双因果网络和成群因果网络,将其作为运动特征,并结合外观特征来描述群体行为。最后,采用改进萤火虫算法的支持向量机(SVM)进行群体行为识别。
移动对象索引技术是有效管理海量移动对象数据的支撑.目前的移动对象索引方法如FNR-tree、NDTR-tree等均采用基于磁盘的索引结构,忽略了移动对象在城市道路上密度分布不均衡
目前基于卷积神经网络的学习方法需要大量的有标注的数据。而实际应用中,标记大量的数据是非常困难的。为了解决此问题,提出了一种基于卷积神经网络的无监督特征提取方法。该方法结合了局部保持投影(LPP)算法和卷积神经网络,LPP算法可以很好地保留图像局部结构。文中采用LPP算法来进行卷积核的学习。构建的网络结构简单有效,识别效率优于有监督的卷积神经网络。实验结果表明,该方法在真实条件下的人脸数据集Yale
目前国网公司在处理语言通信业务时,其行政话机都是通过人工查询通信录,并以手工方式进行拨号通话,效率很低,给用户带来了很多的不便。针对上述情况,文中提出了一种面向智能
衣服与人体的精确匹配是虚拟试衣系统中的关键问题之一.与以往的3D模型匹配、2D图像匹配等方法不同,提出了一种新型的基于2D图像变换的更具有人体贴合性的虚拟试衣算法.算法