基于图卷积神经网络的文本分类研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yl9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是自然语言处理领域中一个经典而又重要的任务。现有的大多文本分类方法都侧重于文本表示,然后使用机器学习算法或深度学习模型进行分类,但这些方法没有考虑文本间隐含的相互关系。对此,本文构建了两种基于图卷积神经网络的文本分类模型HGCN以及HGCN-BERT,在图卷积神经网络中引入文本异构图和注意力机制,得到数据的全局信息来解决上述问题。HGCN模型通过文本异构图将数据集中的信息转化为拓扑图结构表示,将数据集中默认相互独立的文本建立起相应联系。为提高文本分类效果,HGCN模型通过引入文本主题信息,挖掘出文本隐藏的信息扩充了文本信息量,解决了短文本分类情境下信息量稀疏的问题。本文提出融合多级注意力机制的图卷积神经网络,根据节点类型和节点属性的不同,赋予节点不同权重,根据权重对节点信息进行融合得到节点的嵌入表示,最终得到带有全局信息的节点嵌入。HGCN模型通过节点嵌入提升了分类的准确率,但会丢失一些文本的语序信息。针对HGCN模型中文本转化为图结构时丢失文本的语序信息的问题,本文提出基于图卷积神经网络的文本分类模型HGCN-BERT,该模型融合了图卷积网络提供的全局信息与BERT预训练模型的局部信息,将Bi-LSTM与Attention机制结合,用以对文本进行语义表示,最后输出文本的预测类别,完成分类任务。本文就HGCN模型的文本分类效果和HGCN-BERT模型文本分类效果分别设置了不同的实验与基准模型进行对比,用于验证本文技术的可行性与优势。实验表明,HGCNBERT模型在准确率上的表现优于基准模型,证明了本文方法的有效性。
其他文献
在高中阶段,英语阅读技巧是学生进行英语学习的必备能力。在英语考试中,阅读占了很大比例的分数。传统的英语阅读方法以老师为主导,在强调语法和单词的理解中进行的。英语阅读合作学习模式是对传统授课制的一种改进,是一种有效的英语教学方法,是一种目前在国内外都得到广泛认可并逐渐采用的教学模式。本文旨在探索合作学习在英语阅读中的应用,具体探讨了以下两个研究问题:1、合作学习在多大程度上激发了高中生对英语阅读的兴
特征选择方法在现如今这个“数字化”时代被广泛的使用,其作为一种数据预处理手段频频出现。此技术旨在既不损害数据的价值信息表述能力,又能急剧减少数据量。准确率一定是特征选择问题追求的永恒主题,同时时间也是一个重要的评判指标,并且随着待解决数据的列数越来越大,问题空间扩大给算法带来很大挑战。本文采用了粒子群演化算法的手段对特征进行寻优选择,对粒子群特征选择算法实现了如下的改进,主要内容如下:(1)本文首
议论文的议论味,就是文章要符合议论文的文体要求。想把议论文写得具有议论味,要从确立鲜明正确的观点、开篇快速切题、选用恰当的论据、灵活运用论证方法、彰显清晰的逻辑等方面着手,只有具备了这几点,议论文才能具备正宗的议论味。
钱选为代表的“新”青绿山水画家,与传统青绿山水画作品相比,不仅吸取前人的设色和笔墨技法,还对青绿山水画的思想表现进行了意象加工与改造,绘画的形式语言也进行了新的尝试,使青绿山水画发展到另一个新高度。钱选青绿山水画的形式语言表现下,在构图上展现了个性化的独特性的形式语言,表现出其青绿山水画厚重、简洁、拙朴的布局形式;在线性语言上,概括提炼出简洁有力的线条,增加画面的古拙之意;在设色形式上,画面以平涂
水下声源目标定位技术在海洋资源的勘探以及海战场中定位敌对潜艇目标不可或缺,其在水声和国防领域的重要性不言而喻。目前,水下声源定位传统方法是将声源信号和建立的声场模型进行匹配,但存在海洋参数未知和环境失配等一系列问题。随着深度学习在各领域的出色表现,根据其不受环境因素影响的特点以及在声信号处理方向的潜在能力,本文基于深度学习提出一种水下声源定位方法。本文主要工作如下:首先针对水下声源信号中蕴含着目标
南水北调项目工程已经竣工多年,渠道的各个涵洞口由于长时间泥沙的自然堆积,包括树枝树叶自然飘落的沉淀还有生物的排泄物的堆积等等,产生渠道的各个涵洞口淤泥的产生,迫切需要一套水下清淤系统清理这些淤泥。在水下清淤系统中,钢缆绞车、电缆绞车、水管绞车分别提供清淤机器人的回收、控制以及淤泥输送,为清淤机器人提供较为重要的辅助,对水下清淤机器人岸上辅助系统进行研究十分有意义。本文对水下清淤机器人岸上辅助系统进
目前,人类行为识别研究在人机交互领域发挥着举足轻重的作用。随着无线网络的快速发展,Wi Fi信号在公共生活中被广泛的普及和应用,使用Wi Fi信号收集人体的移动信息作为一个新兴的研究热点,正得到智能家居,入侵检测等多个领域的关注。使用无线网络收集人体移动信息,具有部署简单、成本低、应用场景广泛等诸多优点。同时Wi Fi信号中的信道状态信息能够被用于分析人体的步态信息,从而为身份认证技术提供有力的数
现如今基于深度学习的目标检测技术取得了巨大进步,在无人驾驶、军事技术、智能疾病诊断、安防系统等领域得到广泛应用。目前基于Faster R-CNN系列的目标检测算法对小尺度目标特征提取较差,对基于旋转边框的目标检测性能偏低。针对小尺度目标和旋转目标的特性,本文提基于改进Faster R-CNN的旋转小目标的检测技术,取得了很好的检测结果。本课题的研究工作主要包含两个方面:第一,本文提出了一种基于改进
计算机硬件的快速迭代和软件技术水平的不断提高,促进了数据三维可视化技术的长足发展。医学体数据的三维可视化技术改变了传统医学诊断的方式,医生不必再对着二维的诊断图像,凭借主观的判断来构想病灶的相关信息,而是能够直接借助三维图像来进行医学诊断和术前规划。这为病患的诊断和治疗都带来了极大的方便。大脑控制着人类的活动,决定着人类的思维,其重要性不言而喻。对大脑的诊断和治疗都需要极其小心谨慎。若仅仅把大脑的
在海洋工程作业中,船舶与海上建筑物间的人员换乘频繁。不同于陆地换乘作业,海上的风、浪、流会严重影响传统换乘方法的安全性。本文针对具有动力定位系统的工程船舶,设计了一款具有主动波浪补偿功能的人员换乘舷梯(简称波浪补偿舷梯),它可以补偿船舶的横摇、纵摇以及升沉运动,能够在较高海况下安全快速地完成船舶与海上建筑物之间人员换乘通道的搭建,有效降低换乘作业对海洋环境的要求并延长换乘窗口时间。本文主要内容包括