面向大规模分类问题的神经网络动态学习和特征表示方法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:loveagle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
前向多层神经网络对小规模数据集具有良好的学习和分类性能,但随着样本数和类别数的增加,不仅其训练时间大大延长,分类性能往往也会显著降低。本文以面向分类的大规模学习问题为应用背景,针对传统误差反传学习算法在每一轮学习中都让所有样本参与训练而导致学习时间长、推广性能差、样本不平衡严重等缺点,提出了一种神经网络动态学习方法。即在每一轮学习中,只让决策边界附近的样本参与学习以减少实际训练样本数,从而达到加快神经网络的学习速度,改善其推广性能、克服样本不平衡性现象的目的。神经网络的学习过程实际上就是寻找理想决策边界的过程。传统的输入变量归一化或成比例缩小到0-1之间等特征表示方法往往使得样本间的距离变“小”,类别间的分类间隔变“窄”,这样就会导致神经网络的学习时间变长,甚至导致学习过程不收敛。为了解决这一问题,本文提出了一种对输入数据进行编码的新的特征表示方法。对Letter、Shuttle、USPS等数据的分析结果表明,本文提出的方法是有效的。
其他文献
稀疏矩阵相关算法是典型的非规则算法,也是数值计算领域重要的组成部分,现已被广泛应用到各个领域之中。随着数值计算领域的发展,稀疏矩阵算法库已经成为高性能领域的研究热点。
移动对象索引的效率是移动数据管理系统的核心问题。由于大量移动对象位置的频繁改变,导致基于移动对象位置的索引执行效率非常低下。如何降低移动对象位置改变而带来的索引
随着信息化技术和医学数字化影像设备在医学领域中日益广泛的应用,医院每天都将产生大量的医学图像数据。如何有效地管理和运用这些数据成为了目前的研究热点,因此基于内容的
随着时态数据库的深入研究,时态数据量的日益增大,外层应用对时态数据的检索提出了更高的要求。本文建立了一个双时态数据检索模型,结合时态查询的需求,扩充了数据查询语言;并分析
植物是生物圈的重要组成部分,在人类生产、生活的众多领域中都发挥着不可替代的作用。植物分类学是植物学研究和农、林业生产经营领域中非常重要的基础性工作,分类的主要依据
嵌入式设备联网的潮流是大势所趋,如何让嵌入式系统利用丰富的网络资源是当今研究的热点,而嵌入式协议栈的研究是联网设备和技术的研究与开发的热点之一。 TCP/IP协议栈是一
为了解决互联网上信息过载方便人们快速的找到自己所需的感兴趣的信息,产生了文本信息过滤技术。文本信息过滤是指根据用户的信息需求,从大规模动态文本信息流中自动选出用户所
IP组播技术高效地节省了主干网网络带宽、提高了网络资源的利用率,在诸多领域中得到了越来越广泛的应用,成为视频会议、视频点播、网络电视等对带宽占用较高的各种网络多媒体业
在现代Web应用开发过程中,提高用户体验的前端技术被置于越来越重要的位置。随着前端技术的丰富,专门负责前台页面展现的Web工程师从原有的开发人员中独立出来并参与到了协作开
图像存档与传输系统(PACS,Picture Archiving and Communication Systems)的发展推动了医院信息化建设的发展,也带来了新的问题。当前医院环境下各种影像胶片输出设备并存,支