基于云计算平台的代价敏感集成学习算法研究

来源 :山东大学学报(工学版) | 被引量 : 0次 | 上传用户:xiaoyaozhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现实生活中大规模不平衡数据的分类问题,设计了一种基于云计算平台的代价敏感集成学习分类算法。Hadoop云计算平台对海量数据进行划分用于并行学习,同时结合代价敏感的思想对学习得到的基分类器进行加权集成,实现了云计算平台上的代价敏感集成学习分类模型。仿真实验表明该模型能够明显提高少数类的查全率,同时Hadoop的并行机制使得云平台坏境下的集成学习时间较集中式环境有大幅度的缩减,进一步提高了大规模不平衡数据分类问题的学习效率。 In view of the classification of large-scale unbalanced data in real life, a cost-sensitive integrated learning classification algorithm based on cloud computing platform is designed. The Hadoop cloud computing platform divides the massive data for parallel learning, and at the same time integrates the learned base classifier with the cost-sensitive thought to realize the cost-sensitive integrated learning classification model on the cloud computing platform. The simulation results show that the model can significantly improve the recall of a few classes. At the same time, the parallel mechanism of Hadoop makes the integrated learning time under the cloud environment significantly reduced compared with the centralized environment, which further improves the large-scale unbalanced data classification Learning efficiency
其他文献
采用竖(斜)井纵向分段式通风的长大山岭隧道由于涉及隧道特点、交通状况、气象特征、环境要求等多种因素,对通风井与隧道相对位置如何确定目前还没有定论。基于计算流体动力
用M06/6-31+G*方法和PCM(polarized continuum model)溶剂模型研究了CnCu+/2+和CnZn2+配合物在气液两相中的稳定性顺序,重点从溶剂效应和电荷分布等方面讨论分析了与生物环境
研究了锂皂石颗粒对模拟聚合物驱采出水乳化稳定性能和油水界面性质的影响。通过分析含油量表征分析了锂皂石颗粒对聚合物驱采出水乳化稳定性的影响,发现在HPAM质量浓度为100
传统的物元模型用于水安全评价,当指标数较多时需要设计很多关联函数,设计和计算工作量皆很大,实际使用不便。为减少关联函数的设计并使之规范化,本研究提出了基于指标规范值
硫脲类三唑衍生物类化合物在农药创新中占有重要地位,为了揭示其结构与活性之间的关系,为新型杀菌剂的制备和筛选提供理论依据,本研究运用Gaussian 03程序,运用密度泛函理论(
为减小拍振现象对高速精密磨床电主轴加工精度的影响,利用磁悬浮轴承自身的传感器及数字信号处理部件,在不外加其他设备的情况下对电主轴中的拍振进行了观察实测。通过时域、
结合国家3号高速公路枣庄段中央分隔带绿化灌溉工程,试验研究了渗灌技术在高速公路中央分隔带绿化灌溉中的应用问题。进行了室内微孔渗管渗水性能试验和渗灌条件下土壤水分运
针对带有概念漂移的数据流的分类问题,提出一种新颖的能够识别并且适应概念漂移数据流的分类算法。该算法将原始数据流沿着时间轴划分为若干数据块后,选择第一块中有代表性的数
传统的流形学习局部线性嵌入(locally linear embedding,u正)算法通过欧氏距离来选择邻域,如果数据集选自多个类别,这种距离度量方法无法得到正确的邻域关系。本研究提出一种改进
针对现有单类分类器对目标数据先验信息考虑的不足,在结构单类支持向量机(structured one-class supportvector machine,SOCSVM)中嵌入局部密度信息,提出局部密度嵌入的结构