带惩罚项的BP神经网络训练算法的收敛性

来源 :大连理工大学 | 被引量 : 20次 | 上传用户：rockykimi81

【摘要】

：

前馈神经网络在许多领域有着广泛的应用。网络的泛化能力，即网络正确预测训练集之外样本的能力，是衡量神经网络性能的一个重要指标。研究表明，满足训练样本集上逼近精度的规模最

【作者】

：

邵红梅

【出处】

：

大连理工大学

【发表日期】

：

2006年01期

【关键词】

：

前馈神经网络惩罚项 BP算法有界性收敛性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

前馈神经网络在许多领域有着广泛的应用。网络的泛化能力，即网络正确预测训练集之外样本的能力，是衡量神经网络性能的一个重要指标。研究表明，满足训练样本集上逼近精度的规模最小的网络具有较好的泛化能力[1-7]。网络修剪是得到上述小网络的有效途径之一，它包括直接修剪法和惩罚项法。直接修剪法是指从一个很大的足够解决当前问题的网络开始，在训练结束后通过选择或有序的方式删除一些不重要或敏感度较小的连接权和神经元节点[3，8，9]。不过，该方法破坏了网络结构，往往使得网络训练需要很长的时间。惩罚项方法是一种间接修剪网络的办法，其原理是在传统的误差函数中加入一衡量网络结构复杂程度的“复杂度项”。应用到权值更新规则后，该项在训练过程中起到防止权值增长太大和驱使不重要权值逐渐减小到零的作用。尽管那些接近零的连接权没有从网络中被删除。但它们对网络输出几乎没有影响，已相当于从网络中被删除了。这样一来，训练后的神经网络实际上已是被修剪过的小网络了。可见，惩罚项法在没有破坏网络结构的同时又达到网络修剪的目的，从而是提高神经网络泛化能力的一个重要方法。已有许多文献研究了多种不同形式的惩罚项[1-3，6，10-13]，但他们中的大多数是在实验的基础上对惩罚项的性能进行研究的，并没有在数学上给出理论证明。本文从理论上分析了惩罚项对权值的压制作用，从而为以上实验观察结果提供了理论依据。反向传播算法(BP算法)是一种简单又常用的神经网络训练算法，它有批处理和在线两种运行模式。本文主要研究在批处理和在线两种运行模式下，带weigh-decay和inner-product惩罚项的BP算法的收敛性以及引入惩罚项后网络权值的一致有界性。本论文的结构安排如下：第一章回顾一些有关神经网络的背景知识，第二章介绍几种常见的惩罚项，包括weight-decay惩罚项、weight-elimination惩罚项和inner-product惩罚项等。第三章主要讨论带weigh-decay惩罚项的批处理BP算法和改进的批处理BP算法的收敛性。对于前者，我们给出惩罚项系数和学习率之间的一个确定的数学表达式，并证明在此条件下误差函数的单调下降、训练算法的收敛和训练过程中权值的一致有界。对于改进后的BP算法，我们不仅证明了一种变学习率的BP算法的收敛性，还考虑了带动量项的BP算法的收敛性问题。第四章研究带weigh-decay惩罚项的在线BP算法的收敛性。在线学习方式下，训练样本在一个训练回合中呈现给网络的方式分为固定顺序和随机顺序两种。这一章我们证明在线运行方式下，当训练样本以固定顺序呈现给神经网络时带weigh-decay惩罚项的在线BP算法的收敛性。

其他文献

涉税案件行刑交叉问题研究

随着社会经济水平的快速提升,各类犯罪呈现出不同以往的全新发展态势,尤其是涉税案件愈发层见叠出,深入推进对涉税案件的严肃查处、规范治理势在必行。我国《税收征收管理法》第63条、65条、66条、67条、71条与《刑法》第201条至204条、206条、209条分别对涉税违法行为与犯罪行为在行政责任与刑事责任的承担问题上进行了规制,作为其具体责任承担形式的行政处罚与刑事处罚,二者本是两类性质截然不同的制裁

学位

涉税案件行政违法刑事犯罪衔接移送机制

真核翻译起始因子eIF3和eIF5的结构生物学研究

真核生物的蛋白翻译起始是一个复杂的细胞活动进程，它需要一系列的蛋白参与，这些蛋白就被称为真核翻译起始因子(eukaryotic initiation factor，简称为eIF)。目前已经发现了至少1

学位

真核翻译起始因子eIF3eIF3keIF5多因子复合物HEAT结构域支架蛋白晶体结构

血液透析及腹膜透析对糖尿病肾病尿毒症高血压的影响研究

目的研究血液透析及腹膜透析对糖尿病肾病尿毒症高血压的影响。方法按照入院顺序随机抽取我院自2014年4月至2017年4月收治的糖尿病肾病尿毒症高血压患者60例,以随机数字法,分

期刊

血液透析腹膜透析糖尿病肾病(DN)尿毒症高血压

无人航道测量船系统的研制与应用

本文设计了一套完整的应用于内河航道的无人航道测量船系统。系统集成了GNSS、测深仪、ADCP、视频采集等常规测量设备,可应用智能避障、视觉引导和运动控制等算法,实现水深、

期刊

浅水测深无人机飞行系统航摄大比例尺测图折射改正

美国正在起草新的混凝土砌块干垒挡墙设计指南

<正>在美国混凝土砌体协会(NCMA)下属基金会资助下,ADAMA开展的一项研究课题最近完成。课题专门起草了一份混凝土砌块干垒挡墙结构设计方法的框架内容,包括极限荷载设计法,以

期刊

混凝土砌块框架内容

伽玛射线暴持续时间的研究

伽玛射线暴(简称伽玛暴,GRB)的中心引擎是伽玛暴之谜中最为核心问题之一。伽玛射线辐射的持续时间是伽玛暴重要的观测量。1991年发射的CGRO/BATSE卫星对伽玛暴巡天观测发现,

学位

伽玛射线暴数据分析统计

毛细管电泳电化学发光及其联用技术在心血管药物和生物碱中的应用研究

毛细管电泳-电化学发光(Capillary Electrophoresis-Electrochemiluminescence,CE-ECL)是一种结合了毛细管电泳的样品消耗少、分析速度快,分离效率高和电化学发光背景信号低

学位

毛细管电泳电化学发光心血管药物生物碱超声微透析

开发旅游档案服务旅游事业

开发旅游档案服务旅游事业太原市南城区档案馆翟荷鱼目前，山西省有各类旅行社（公司）１０１家，在旅游服务活动中形成了大量的档案，由于无专人收集、整理、立卷、归档，加之旅游行业工作人员

期刊

旅游档案太原市档案馆旅行社档案材料旅游事业

《危险的手相》

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

急性ST段抬高型心肌梗死合并心源性休克患者非梗死相关血管慢性完全闭塞病变治疗对预后的影响

急性ST段抬高型心肌梗死(STEMI)合并非梗死相关血管慢性完全闭塞病变(CTO)容易发作心源性休克增加病死率。目前研究已经证实,STEMI患者合并多支血管病变的心源性休克患者,迅

期刊

ST段抬高型心肌梗死慢性完全闭塞病变心源性休克

带惩罚项的BP神经网络训练算法的收敛性

其他学术论文