在线预测的极限学习机方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:yzhyzhyzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线预测一直是智能信息处理领域的前沿课题,在异常诊断、系统控制、信号监测和行为推理等工程问题中具有重要的应用价值。机器学习通过数据驱动的方式建立表征数据关系的非线性模型,能够对新数据做出有效预测。作为机器学习的代表性方法,极限学习机由于具有理论解析解和收敛速度快的优势,适用于具有海量、多样、高速和真实等特征的大数据环境。在实际场景中,由于实时采样的业务需求和计算机缓存的限制,数据呈现出逐个到达或片段式到达的特点,形成实时数据流。复杂多变的流式数据要求模型能根据当前数据片段的预测结果自动调整结构,无需人工参数调整和学习模型的重新训练,这对预测算法的有效性和适应性提出了挑战。极限学习机通过模拟人类学习行为,建立多层神经元连接结构,表征属性和标签的映射关系,实现具有语义特征的智能信息处理。在训练阶段,利用M-P广义逆计算输出权重,避免了繁杂的参数遍历过程。其中自适应极限学习机、惩罚加权极限学习机等能够有效解决复杂函数逼近问题,已经成功应用于离线预测。但是随着数据的累积,数据结构会随着时间显著变化,导致离线预测方法失效。如何建立参数和结构自动调整的在线预测模型,适应变化环境的学习任务仍有待深入研究和进一步完善。本文考虑不同类型的数据标签和不同结构的属性集合,围绕在线预测的极限学习机方法展开研究,解决长期累积数据、时变的不平衡标签、自增长特征空间和非结构化图像序列的在线预测问题,旨在提高机器学习方法在变化环境中的鲁棒性和适应性,探索大规模数据在线预测的新方法。论文的主要创新性工作如下:(1)针对长期预测中模型自动调整问题,提出了平衡方差和偏差的动态ELM方法,解决了经典ELM预测模型依赖初始结构,无法定量调整的问题。该方法引入了关于拟合程度的度量参数,将时间序列的误差进行分解,比较了方差和偏差的变化,实现了对过拟合和欠拟合的定量表达;建立平衡拟合能力和自由度的惩罚回归模型,采用粒子群算法实现了隐层节点数目和正则化参数的联合优化,形成了自动更新策略,避免了交互式的参数调整,保证了预测模型适用于长期在线预测。实验结果表明所提方法能够适应数据变化趋势,与代表性的在线预测方法相比,所提方法在4组不同属性维度的UCI标准数据中具有更低的泛化误差和更高的相关系数。(2)针对多类样本标签不平衡序列在线预测问题,提出了基于两步博弈的集成动态ELM方法,解决了数据标签平衡度偏移和重构数据不准确的问题。该方法采用了数据处理和模型更新联合策略,进而自动匹配样本的结构变化;在数据处理阶段,采用动态ELM博弈模型生成少数类样本,平衡不同类别样本分布;与传统的重采样方法不同,所提方法融合了零和博弈策略和主成分分析阈值判决,保证了每个样本片段的真实性;在模型更新阶段,利用信息熵量化整体的拟合程度,建立了权重与损失程度之间的关系,并采用博弈论中的集合模型计算组合权重,形成了稳定的网络体系结构,避免将多分类问题转化为多个二分类造成的模型适应性差的问题,提高了模型对快速变化数据的拟合效果。实验结果表明,在6组多类不平衡UCI标准数据集中,所提方法具有更高的G-mean和F-measure值,改善了动态ELM方法对少数类样本的预测能力。(3)针对特征维度增加的非平稳序列在线概率预测问题,提出了基于分位数估计的动态ELM方法,解决了非平稳序列特征维度增加,置信区间表征单一的问题。对于期望值的点预测,该方法考虑了不断增长的特征空间,定义特征向量和标签的相似度作为特征阈值,实现了对新特征的在线提取;建立集成学习模型,通过人工蜂群算法进行联合优化,得到最优的参数解向量,减少了输入层权重和偏置的随机性;根据片段平均误差调整模型过滤阈值,提高了模型的紧凑性。对于置信区间预测,该方法采用模糊推理和二维核密度估计判决预测值的置信区间,突破了误差必须满足特定概率分布的局限,得到平滑的概率密度表达。选取表征光伏电能转化情况的典型非平稳数据进行实验,结果表明,所提方法获得了较高的泛化性能和置信度,匹配了非平稳序列的周期性和波动性。(4)针对非结构化的图像序列在线预测问题,提出了基于目标主轨迹的多层ELM方法,解决了小样本图像序列特征难表征以及模型和语义无法关联的问题。该方法充分考虑了图像的时空特性,采用帧差法和k-means聚类分析,实现了不同运动目标的像素级提取;利用二阶指数平滑方法,计算每一个运动目标的主轨迹,实现对多个目标运动趋势的预测;通过多层ELM量化形状特征,建立历史序列和当前图像感兴趣区域的映射关系,重构了新的感兴趣区域,保证了新图像的真实性;利用FISTA方法加快了参数优化的收敛速度,简化了深度神经网络的求解过程。选取表征行人和车辆运动状态的图像序列进行实验,结果表明,所提方法提高了在线预测的准确性和图像分辨能力,有效挖掘了图像序列整体的语义特征,无需对每一个像素点建立模型,提升了预测效率。
其他文献
目的 :探讨血府逐瘀汤对自发性高血压大鼠 ( spontaneously hypertension rat,SHR)血管重建的干预作用。方法 :2 0周龄 SHR42只 ,随机分成四组 :对照组 ( 组 )、生理盐水组
乳腺钼靶图像检查是目前公认的最安全有效的乳腺癌早期检测方法之一,但医生手工阅片却很难避免漏诊和误诊,研究基于影像学的乳腺病灶的自动检测和良恶性诊断方法具有重要的临床应用价值。基于深度学习的方法,研究乳腺钼靶图像中的肿块的自动检测和良恶性诊断方法。针对图像中乳腺区域像素值分布范围较窄和肿块边界模糊等问题,采用了截断归一化方法,并与自适应直方图均衡化算法相结合来对原始图像进行预处理。针对现有数据集样本
恶性肿瘤是一种严重威胁人类健康和生命的疾病,提高其诊断的精确度和治疗效果能够有效的降低肿瘤患者的死亡率。传统的肿瘤诊疗方式存在各自的局限性,而新兴起的纳米诊疗剂集
主要从比较的角度研究了适合典型工业过程的4种PID控制器参数的整定方法,包括临界比例度法、衰减曲线法、鲁棒PID参数整定法和ISTE最优参数整定法。数字仿真以一阶惯性加时滞
<正>为了促进学科发展,充分发挥中国硅酸盐学会的学术交流优势和《硅酸盐学报》作为开展学术交流、学术争鸣重要阵地的作用,定于2019年8月23日~25日在陕西省西安市举办第11届
无人水下航行器(UUV)在军事及民用领域有着广泛的应用前景,一直以来备受各国重视。动力技术是制约其发展的关键技术,对于航行器有着重要的作用。目前UUV主要使用电动力推进,而
情感教学理论强调通过对教学中情感因素的充分重视和有效调动,最大限度地发挥情感因素的积极作用,优化教学,促进学生素质的和谐发展。本研究尝试将这一教育理论应用于《实验
网上拍卖是近年来发展最为快速的交易形式之一,它快捷,方便,形式新颖,成本低廉,深受广大交易者的青睐。与传统拍卖不同,由于网上交易的非现场属性,交易双方彼此之间互不见面
村落公共空间是村落历史文化的传承载体,是历史文化村落保护利用的重要范畴之一。文章从社会生活角度出发,结合调研探析次坞新村公共空间属性与特征,挖掘建筑、街巷、节点空
动物,是中国古代文学作品中的重要角色之一,在民间故事和志怪小说中占有举足轻重的地位。在魏晋志怪小说中,以动物为题材的文学作品特别多。东晋干宝的《搜神记》作为志怪小