基于神经网络集成Ada-S算法的文本分类

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:wcd_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的普及和信息技术的不断发展,网络在人们生活中的作用越来越大,网络中的文本信息也不断积累,种类复杂多样,文本分类系统的完善显得尤为重要。需要进行分类的文本往往参差不齐,分布不均衡,并含有噪声。前人使用神经网络集成算法对文本进行分类,但是由于Adaboost算法本身容易在有噪声或样本分布不均时产生过训练,造成过拟合现象,极易影响文本分类系统的性能。本文以Adaboost算法的这一缺陷为出发点,对算法进行改进,降低过拟合现象的发生,同时将改进算法应用到文本分类,提高文本分类的准确性。本文的主要工作分为三部分:文本的预处理;基于样本分布、抑制过拟合的Adaboost算法的改进算法——Ada-S算法;Ada-S算法在文本分类中的应用。本文主要针对神经网络集成算法中的Adaboost算法进行了改进。本文通过对算法中样本权重的调整策略进行的改进,使样本权重的变化幅度不仅仅依据分类器的识别情况,还根据样本的分布情况做出适当地调整,避免Adaboost算法过度关注噪声样本及困难样本,使Adaboost算法的过拟合现象有所下降,尤其是降低了噪声比例较大时过拟合现象的发生,一定程度上提高了Adaboost算法的泛化性能。同时,本文对上述改进算法的调节因子根据各类样本参加训练的情况进行优化,使Adaboost算法能够进一步提高分类的准确性。最后,本文将改进的算法Ada-S应用到文本分类中,通过与原始的Adaboost算法进行比较,改进算法Ada-S的泛化性能和文本分类评价指标均有相应的提高。
其他文献
近年来,自然界中生物群体的突现行为成为人工智能和复杂系统领域的研究热点。这源自其在无人飞行器的协调控制、多机器人的编队控制、无线传感器网络等多智能体系统的直接应用
近几年来,随着计算机网络的迅速发展,网络技术和视频技术有了长足的进步,尤其VolP技术的不断强化与完善,网络视频传输系统的应用正变得愈来愈普遍。自从VolP诞生以来,以其低廉的成
无线传感器网络(Wireless Sensor Network)技术在当今得到了飞速的发展,它具有成本低廉、部署方便且迅速,能适应苛刻的环境等特点。同时随着工业现场控制网络技术的发展,把WS
版权认证是一种对载体进行认证版权归属的行为,要求载体经过一定程度的正常修改能识别出其作者,而经过恶意篡改后的载体能检测出不同于原载体的版权归属。目前最常使用的版权认
无线传感器网络(WirelessSensorNetwork,WSN)是由大量具有感知、信息采集、数据处理以及无线通信等功能的传感器节点组成的自组织分布式网络。近年来,无线传感器网络的应用越来
信息推送服务是指根据用户对信息的需求,有针对性和目的性地将信息主动送达用户。通常采用客户-服务器机制,由服务器主动将信息推送给客户端。在消息推送服务过程中,无需客户机
目前,云计算作为一种新兴的计算模式,正被全世界人们广泛关注。云计算以其增强的计算能力,无限的存储容量,对用户端设备要求低以及高扩展性、高性价比和高度灵活性等优势,相比于传
短时交通流量预测是智能交通系统研究的关键。能否对短时交通流量进行实时的、准确的预测对实现交通控制和诱导起到了至关重要的作用。因此,对短时交通流量的预测研究具有十分
视觉认知是人类获取信息的重要方式,在视觉认知过程中,客观世界都以图像形式存在。图像分割作为视觉认知的基础,其目的是:从大量复杂的背景中,提取所需信息。但是,由于图像信息的
视频运动目标跟踪,这个课题作为机器视觉研究的一个主要分支,它就是对视场内的非静止的目标,如人和车辆等,进行实时的观测,并在这个基础上对把被观测对象按一定方法进行分类,然后仔