基于随机森林的流处理检查点性能预测

来源 :电子与信息学报 | 被引量 : 6次 | 上传用户:eimayao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物联网(IoT)的发展引起流数据在数据量和数据类型两方面不断增长。由于实时处理场景的不断增加和基于经验知识的配置策略存在缺陷,流处理检查点配置策略面临着巨大的挑战,如费事费力,易导致系统异常等。为解决这些挑战,该文提出基于回归算法的检查点性能预测方法。该方法首先分析了影响检查点性能的6种特征,然后将训练集的特征向量输入到随机森林回归算法中进行训练,最后,使用训练好的算法对测试数据集进行预测。实验结果表明,与其它机器学习算法相比,随机森林回归算法在CPU密集型基准测试,内存密集型基准测试和网络密集型基
其他文献
由于车载应用的普及和车辆数量的增加,路边基础设施的物理资源有限,当大量车辆接入车联网时能耗与时延同时增加,通过整合内容分发网络(CDN)和移动边缘计算(MEC)的框架可以降低时延与能耗。在车联网中,车辆移动性对云服务的连续性提出了重大挑战。因此,该文提出了移动性管理(MM)来处理该问题。采用开销选择的动态信道分配(ODCA)算法避免乒乓效应且减少车辆在小区间的切换时间。采用基于路边单元(RSU)调
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
为提高信号采样值之间的相关性和降低噪声对感知性能的影响,该文提出基于信号包络自相关矩阵的频谱感知算法。首先对采样信号等间隔时长截取,以相邻间隔的采样值计算信号自相关性,并构造出近似自相关矩阵。其次依据矩阵次对角线元素性质构造了统计量。分别计算了该统计量的检测概率分布函数与虚警概率分布函数,分析了频谱感知算法的检测性能,算法优化了信号相关性的计算,降低了噪声对感知性能的影响。最后通过仿真验证了不同参
摘要:基础教育协同发展是京津冀协同发展战略当中十分重要的一项内容,其从理论供应环节到具体的落实都在不断地完善当中。但在现今阶段,由于教育协同管理体系还不够完善,以及相关资源有所稀缺,因此也容易产生一些问题。对此,我们应在加强前期合作的基础上,制定出京津冀教育协同发展管理体制,通过整体布局来进一步提升区域内教育的竞争能力,通过对基础教育资源和质量进行动态监测等来进一步提升发展水平。本文针对京津冀基础
在当前的幼儿园教育机制下,要促进幼儿的心理健康发展,需要运用家园联动的方式,切实转变家长的健康观念,关注幼儿的心理健康问题,同时通过构建幼儿心理健康教育的跟踪机制、
可变剪接是一种广泛存在于生物体中造成蛋白质多样性的重要机制,它对细胞的增殖、分化、发育、凋亡等一系列重要的生物过程具有重要精细调控的作用。近年来,人们发现多种复杂疾病的产生往往伴随着剪接异构体的紊乱表达。为了研究剪接异构体在整体分布上的差异,该文提出一种基于中值的JS散度可变剪接(AS)差异分析方法。结果表明,该文的方法能够发现大量在剪接异构体整体分布上具有显著差异的基因。这些基因不仅富集在一些癌
深度学习是一种自主建构知识、积累数学活动经验和思想方法,发展高阶思维能力的有意义的数学学习,强调知识的广度、深度、关联度。文章以人教版"最大公因数"一课"预习学习单"
类属属性学习避免相同属性预测全部标记,是一种提取各标记独有属性进行分类的一种框架,在多标记学习中得到广泛的应用。而针对标记维度较大、标记分布密度不平衡等问题,已有的基于类属属性的多标记学习算法普遍时间消耗大、分类精度低。为提高多标记分类性能,该文提出一种基于标记密度分类间隔面的组类属属性学习(GLSFL-LDCM)方法。首先,使用余弦相似度构建标记相关性矩阵,通过谱聚类将标记分组以提取各标记组的类
特征子空间学习是图像识别及分类任务的关键技术之一,传统的特征子空间学习模型面临两个主要的问题。一方面是如何使样本在投影到特征空间后有效地保持其局部结构和判别性。另一方面是当样本含噪时传统学习模型所发生的失效问题。针对上述两个问题,该文提出一种基于低秩表示(LRR)的判别特征子空间学习模型,该模型的主要贡献包括:通过低秩表示探究样本的局部结构,并利用表示系数作为样本在投影空间的相似性约束,使投影子空
该文针对双层非正交多址系统(NOMA)中基于能量效率的资源优化问题,该文提出基于双边匹配的子信道匹配方法和基于斯坦科尔伯格(Stackelberg)博弈的功率分配算法。首先将资源优化问题分解成子信道匹配与功率分配两个子问题,在功率分配问题中,将宏基站与小型基站层视作斯坦科尔伯格博弈中的领导者与追随者。然后将非凸优化问题转换成易于求解的方式,分别得到宏基站和小型基站层的功率分配。最后通过斯坦科尔伯格