论文部分内容阅读
随着互联网的飞速发展,信息技术的广泛应用,当今时代产生了海量的文本数据,如何对这些数据进行有效的管理,并从中发掘有价值的信息成为大数据时代面临的挑战。文本分类作为文本信息处理的关键技术以及自然语言处理的经典任务,一直是人们关注的焦点。随着深度学习在图像处理,语音识别等领域取得了显著的成果,它也被证明在自然语言处理任务中拥有提取句子或文本更高层次表示的能力,然而单一深度学习模型存在忽略上下文语序或关键词区分化影响等语义缺失问题。因此,设计基于深度学习混合模型的文本分类算法,通过混合模型综合各个模型的优势,提取语义丰富的高层特征已成为研究热点。本文在分析文本分类技术及深度学习模型的基础上,对如何合理设计深度学习混合模型,并利用该模型提取高层特征,解决文本分类问题进行了深入研究。本文的主要研究工作如下:(1)针对单一模型的语义缺失问题,通过探究多种深度学习模型的组合可能和提升效果,本文设计并实现了 Attention-Based C-GRU混合模型用于文本分类。该模型由输入层,C-GRU特征提取模块,Attenton机制加权模块和Softmax分类器模块组成。模型将改进后的卷积层结构和GRU模型以统一的架构进行组合,构成提取高级特征的二层网络,利用CNN和GRU的模型优势,提高了文本分类的分类效果。(2)针对传统CNN模型忽略文本上下文语序,导致文本语义缺失的问题,本文提出了卷积层改进算法。将卷积层从CNN模型中抽离出来,并对卷积层结构进行改进,通过定义不同尺寸的区域序列向量RSV,产生对不同位置词向量的抽象特征表示,该表示方式通过结合多个局部特征,形成更为准确的特征表示,并且抽象特征序列保持了文本的语序关系,丰富了语义,提高了特征提取的效率。(3)Local-Attention窗口维度的选取随机性造成了关键词丢失或语义冗余等问题,针对该问题,本文通过探究提出了窗口最佳维度的选取策略。利用该策略合理的选取Local-Attention计算范围,提升了 Local-Attention的优化效率,提高了关键词区分化对文本分类的影响作用。为了证明Attention-Based C-GRU模型的有效性,验证卷积层改进算法及Local-Attention机制优化策略对文本分类的提升效果。本文在中英文语料集上设置多组对比实验,通过与对比模型和语料集上表现最优的算法做比较,证明了本文模型在文本分类的有效性,以及改进算法的提升效率。