基于神经网络集成Ada-S算法的文本分类

来源 :北京化工大学 | 被引量 : 1次 | 上传用户：wcd_wang

【摘要】

：

随着计算机网络的普及和信息技术的不断发展，网络在人们生活中的作用越来越大，网络中的文本信息也不断积累，种类复杂多样，文本分类系统的完善显得尤为重要。需要进行分类的文本往

【作者】

：

甄丹彤

【机构】

：

北京化工大学

【出处】

：

北京化工大学

【发表日期】

：

2013年01期

【关键词】

：

神经网络集成 Adaboost 过拟合噪声样本文本分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机网络的普及和信息技术的不断发展，网络在人们生活中的作用越来越大，网络中的文本信息也不断积累，种类复杂多样，文本分类系统的完善显得尤为重要。需要进行分类的文本往往参差不齐，分布不均衡，并含有噪声。前人使用神经网络集成算法对文本进行分类，但是由于Adaboost算法本身容易在有噪声或样本分布不均时产生过训练，造成过拟合现象，极易影响文本分类系统的性能。本文以Adaboost算法的这一缺陷为出发点，对算法进行改进，降低过拟合现象的发生，同时将改进算法应用到文本分类，提高文本分类的准确性。本文的主要工作分为三部分：文本的预处理；基于样本分布、抑制过拟合的Adaboost算法的改进算法——Ada-S算法；Ada-S算法在文本分类中的应用。本文主要针对神经网络集成算法中的Adaboost算法进行了改进。本文通过对算法中样本权重的调整策略进行的改进，使样本权重的变化幅度不仅仅依据分类器的识别情况，还根据样本的分布情况做出适当地调整，避免Adaboost算法过度关注噪声样本及困难样本，使Adaboost算法的过拟合现象有所下降，尤其是降低了噪声比例较大时过拟合现象的发生，一定程度上提高了Adaboost算法的泛化性能。同时，本文对上述改进算法的调节因子根据各类样本参加训练的情况进行优化，使Adaboost算法能够进一步提高分类的准确性。最后，本文将改进的算法Ada-S应用到文本分类中，通过与原始的Adaboost算法进行比较，改进算法Ada-S的泛化性能和文本分类评价指标均有相应的提高。

其他文献

3-zone粒子模型的改进及突现行为研究

近年来，自然界中生物群体的突现行为成为人工智能和复杂系统领域的研究热点。这源自其在无人飞行器的协调控制、多机器人的编队控制、无线传感器网络等多智能体系统的直接应用

学位

群体行为突现行为外界干扰3-zone粒子模型扰动动力学突现控制人工智能

基于RTP的实时视频传输技术研究

近几年来，随着计算机网络的迅速发展，网络技术和视频技术有了长足的进步，尤其VolP技术的不断强化与完善，网络视频传输系统的应用正变得愈来愈普遍。自从VolP诞生以来，以其低廉的成

学位

多媒体通信视频传输时域交叉RTP协议

工业无线网络分簇密钥管理方案研究

无线传感器网络(Wireless Sensor Network)技术在当今得到了飞速的发展,它具有成本低廉、部署方便且迅速,能适应苛刻的环境等特点。同时随着工业现场控制网络技术的发展,把WS

学位

工业无线网络WSN WIA-PA网络安全密钥管理

基于句法和语义的中文文本零水印研究

版权认证是一种对载体进行认证版权归属的行为，要求载体经过一定程度的正常修改能识别出其作者，而经过恶意篡改后的载体能检测出不同于原载体的版权归属。目前最常使用的版权认

学位

零水印文本语义依存句法词语相关度计算词汇链

无线传感器网络的能耗均衡路由算法研究

无线传感器网络(WirelessSensorNetwork，WSN)是由大量具有感知、信息采集、数据处理以及无线通信等功能的传感器节点组成的自组织分布式网络。近年来，无线传感器网络的应用越来

学位

无线传感器网络WSNLEACH负载均衡分簇路由NS2仿真

移动终端消息推送机制研究及应用

信息推送服务是指根据用户对信息的需求，有针对性和目的性地将信息主动送达用户。通常采用客户-服务器机制，由服务器主动将信息推送给客户端。在消息推送服务过程中，无需客户机

学位

移动终端消息推送动态权值队列调度算法动态连接

云计算中的P2P网络资源搜索算法的研究

目前，云计算作为一种新兴的计算模式，正被全世界人们广泛关注。云计算以其增强的计算能力，无限的存储容量，对用户端设备要求低以及高扩展性、高性价比和高度灵活性等优势，相比于传

学位

云计算P2P网络拓扑结构资源搜索算法超级云节点PeerSim仿真

短时交通流预测算法研究

短时交通流量预测是智能交通系统研究的关键。能否对短时交通流量进行实时的、准确的预测对实现交通控制和诱导起到了至关重要的作用。因此，对短时交通流量的预测研究具有十分

学位

智能交通系统短时交通流量非参数回归空间自相关K-Means聚类KD树子样

基于概念内涵与外延双向认知变换的图像分割方法研究

视觉认知是人类获取信息的重要方式，在视觉认知过程中，客观世界都以图像形式存在。图像分割作为视觉认知的基础，其目的是:从大量复杂的背景中，提取所需信息。但是，由于图像信息的

学位

云模型不确定性粗糙集图像分割双向认知模型

基于粒子滤波和Mean Shift的多特征融合的目标跟踪算法

视频运动目标跟踪，这个课题作为机器视觉研究的一个主要分支，它就是对视场内的非静止的目标，如人和车辆等，进行实时的观测，并在这个基础上对把被观测对象按一定方法进行分类，然后仔

学位

运动目标SIFT特征点动态粒子滤波均值漂移目标跟踪算法多特征融合

基于神经网络集成Ada-S算法的文本分类

与本文相关的学术论文