模糊多准则决策方法在大数据分类中的研究

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:ewtfgtwegv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是大数据中重要的一部分,而分类是数据挖掘的核心技术之一。随着近年来研究的进行,有创新性的分类算法越来越多,而且这些算法正广泛地应用于大数据处理中。对于一些大数据处理任务,往往有几种甚至几十种相关的分类算法可供研究者选择,从这些算法中如何选择出适合的算法,是数据挖掘领域中公认的重要问题。另外,分类算法运行过程是否可靠、运行是否有效率等问题,也很难得到检验。基于以上原因,本文对特定数据环境下分类算法的选择问题进行了研究,具体内容如下:(1)介绍和分析了多准则决策(MCDM)、模糊集、模糊多属性决策(FMADM)的方法、聚合算子、分类算法以及分类算法的评价指标等关键技术,结合聚合算子对MCDM方法进行了改进,使之适合模型评价的环境。并对K近邻算法、神经网络算法、贝叶斯网络算法、C4.5算法、CPAR算法等基本分类算法进行了相应的研究。(2)利用模糊集理论改进了K近邻算法,并通过算法评价模型对模糊K近邻(FKNN)算法进行评价。引入模糊集的基本概念,对K近邻算法进行改进,在传统的K近邻分类算法的基础上,引入了模糊集理论,并结合了模糊C-means算法。利用隶属度的计算代替欧氏距离的计算,利用模糊C-means聚类样本数据,提高模糊K近邻分类的效率。之后,建立算法评价模型,对K近邻算法和用于对比实验的算法进行评价,以此检验算法有效性和评价模型的可靠性。(3)为了将算法评价模型扩展到大数据分类算法中使用,本文利用Hadoop框架的MapReduce技术,为改进的模糊K近邻算法做了并行化设计,并使用备选的五种算法分别处理相同的两组数据集,得到运行结果。运行结果包括真正率、真负率、查准率等在内的多个性能评分情况。(4)建立大数据分类算法评价和选优模型,对备选分类算法的数据运行结果,分别采用层次分析法(AHP)、TOPSIS方法和基于MSM算子的多属性决策方法对数据进行评价。在取得每种方法的评价结果后,将所有的评价结果进行二次知识发现,获得更具有可靠性的方案。
其他文献
党的十九大报告指出,“三农”问题是全党工作的重中之重,实施乡村振兴战略,要坚持农业农村优先发展,加快推进农业农村现代化。2017年3月,习近平总书记在十二届全国人大五次会
目的 探讨行为转变理论在妊娠期糖尿病患者自我护理中的应用效果。方法 便利抽样法选取2015年6-12月在上海市嘉定区妇幼保健院产科门诊就诊的妊娠期糖尿病孕妇110例为研究对
目的本研究通过临床观察来分析髋臼股骨头成形术治疗成人髋臼发育不良的疗效机制。方法从1997年1月至2003年1月广州中医药大学第一附属医院骨三科采用髋臼股骨头成形术结合通
目的:探讨胃癌组织中整合素β1、血管内皮生长因子(VEGF)的表达及与胃癌浸润、转移的关系。 方法:1、应用免疫组织化学技术检测63例胃癌组织中整合素β1、血管内皮生长因子(V
随着我国城市轨道交通建设的蓬勃发展,其对防雷减灾的要求也随之而增加,由于城市轨道交通系统存在内部结构复杂,涉及专业较多,占地面积巨大等特点,但目前的防雷设计环节尤其
产酶溶杆菌OH11菌株对许多植物病原菌的生长有着抑制作用。该菌产生的热稳定抗真菌因子(Heat-Stable Antifungal Facter,HSAF)次生代谢产物,能够抑制植物病原真菌及卵菌生长。
随着手机、PDA和各种移动接入设备的普及,越来越多的信息正从PC转移到手机等网络终端上,同时,利用这一终端设备的犯罪也逐渐增加。文章研究了Android平台下手机木马植入、Rootki
现代心理学正处在一个从消极心理学模式向积极心理学模式转换的转折时期,积极心理学应运而生,给似乎有些沉闷的心理科学带来新的冲动和活力。而心理弹性研究方兴未艾,它从一
对来自9个主产地的中国板栗种子、叶片进行取样,分别测定坚果及叶片7项形态指标。结果表明,各形态指标在同一群体不同品种间差异显著,多形现象较为明显;不同群体间板栗叶片及
随着互联网的发展,社会公众借助微博、微信等自媒体平台表达自己对案件的观点和看法,已经成为一种舆论监督司法的新态势.在这一背景下文章以"聂树斌案"为线索,论证自媒体环境下