基于图注意力神经网络的半监督文本分类

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:sws1274
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是自然语言处理中最基础也是最重要的任务之一,它可以发现文档之间的规律并判别不同文档的类别。文本分类利用数据挖掘和机器学习等常用方法,可以对文本或数据进行有效分类,为文本的获取和利用提供了更高效的方法。随着web2.0时代的到来,产生的各种类型的数据和信息使得数据呈爆炸式增长,给信息检索带来很大的困扰。在海量的文本数据中实现对文本的快速分类,并且实现文章推荐、语义分析、信息检索、信息抽取和机器翻译等需求成为研究热点。本文首先介绍了基于特征融合的文本信息图的构建。由于有些文本数据是关系型数据,数据与数据之间会存在某种关系。比如引文网络,在引文网络中文本与文本之间存在引用关系,利用引用关系可以清楚地判别两篇或多篇文章是否为同一类文章。本文所设计的文本信息图主要是通过抽取文本的概要特征,并将文本作为节点,引用关系作为边,根据文本间的参照关系进行构造。然后通过图所蕴含的文本间的多层特征融合关系,讨论了文本间不同的关联关系。其次提出了加入残差连接的图卷积神经网络。由于神经网络模型在层数很深时容易出现过平滑问题,这限制了模型从高阶提取信息的能力。而对于很多非结构化数据,与其距离较远、间接相连的节点也存在有用信息。因此我们在图神经网络的基础上引入了残差连接。残差连接保证了网络参数可以在深层次网络中进行更新和学习,避免了过平滑问题的产生。最后提出了基于双层注意力机制的半监督文本分类模型。图卷积神经网络(Graph Convolutional Network,GCN)由于其可扩展性和高效性,被广泛用于文本分类任务中。但是GCN进行分类时需要读取整个图结构,然而图结构非常庞大。因此本文利用图中信息传播的特点提出了类别级和节点级双层注意力机制,可以为节点的相邻节点分配不同的权重,通过只关注局部图(节点的邻近节点区域)来避免读取整个图结构,从而降低计算复杂度,节省存储空间。为证明本文提出的模型的有效性,将该模型与其他模型做了相应的对比实验,实验结果表明该模型在五个基准数据集上均取得了不错的效果。
其他文献
随着以手机为代表的移动网络客户端和高速信号传输技术在全社会的推广普及,短视频逐渐成为了当前信息传播中最有影响力的工具之一。美食类短视频作为短视频市场的一个垂直细分领域,在促进饮食信息传播、推动饮食文化交流和带动餐饮消费增长等方面发挥了巨大作用,受到越来越多人的关注和喜爱。本文选取美食类短视频作为研究对象,分析美食类短视频在传播过程中有哪些因素会对用户的使用行为产生影响以及影响作用是如何发生的。本文
学位
城市是现代文明和社会进步的标志,也是社会经济发展的主要载体。城市形象作为城市综合实力的重要组成部分,凝聚着整个城市的物质基础与精神面貌,随着中国城市的日益发展,城市间竞争日趋激烈,城市形象在城市建设与发展中的作用越发凸显。城市形象的传播离不开大众传媒的助力,互联网的技术发展推动微信公众号的功能不断更新、优化,许多城市纷纷开始利用微信塑造城市形象、传播城市文化,政务微信因其权威性、组织性成为各大城市
学位
2020年新冠肺炎疫情期间,“雷神山”“火神山”医院建设慢直播俘获了亿万用户的心。随着现代传播技术的发展与进步,移动新闻慢直播这一新型的传播形式逐渐进入大众的视野,各大平台也纷纷开展了对移动新闻慢直播的实践和探索。如何将场景合理地应用于移动新闻慢直播中,从而提高新闻传播效果,是媒体行业开展移动新闻慢直播需要面对的问题,也是研究移动新闻慢直播场景构建的意义所在。本文使用个案分析法和内容分析法相结合的
学位
中共宁波市委十二届五次全会通过《宁波市委关于加快发展生态文明建设美丽宁波的决定》以来,宁波市一直重视环境方面的工作。发展生态文明,建设美丽宁波的工作需要宁波市政府、企业、社会组织、公民等各方主体的共同努力。《宁波日报》是中共宁波市委机关报,该报始终坚持正确的舆论引导方向,体现时代的特点,注重指导性、服务型、可读性,追求拉近与群众之间的距离,追求贴近实际,并且在以宁波本土为立足点的同时还反映国内外新
学位
经济全球化、数据化和信息化使得世界经济活动的联系更为紧密。近两年,新冠肺炎使全球经济活动受阻,全球面临着经济危机挑战。对于全球企业和政府而言,探究全球经济的发展趋势并且制定相适应的经济战略决策来应对未来的经济的挑战极其重要。2021年,世界银行发布了一份《全球经济展望》报告。该报告全面分析了全球疫情状况和经济政策挑战,客观分析了当下经济的发展趋势,对各国政府及企业均有指导意义。该翻译实践报告在信息
学位
党的十八大以来,习近平总书记始终强调创新理念,重视创新实践发展。自2014年9月李克强总理提出“大众创业,万众创新”以来,女性创业者已经成为创业大军中的一支重要力量,党和国家对“她力量”的不断崛起十分重视。本文运用社会性别理论分析女性创业者形象,关注女性媒介形象的构建、女性意识的觉醒,为“媒介与社会性别”领域的学术研究尽绵薄之力。本文选择中华全国妇女联合会机关报《中国妇女报》2000—2020年期
学位
图像超分辨率(Super-resolution,SR)重建近年来越来越受到研究界的关注。SR重建旨在将缺乏细节的低分辨率(Low Resolution,LR)图像恢复成具有更高视觉质量和精细细节的高分辨率(High Resolution,HR)图像。该技术可以降低硬件设备的成本,克服拍摄环境的限制,在军事、公安、医疗诊断等领域具有广阔的实际应用前景。深度学习具有强大的特征学习和表征能力,在计算机视
学位
近几年来各种“黑天鹅”、“灰犀牛”事件的频发,使得股票市场投资者极易产生恐慌情绪,投资者情绪波动引起全球金融市场的剧烈动荡,严重影响股票市场稳定。因此如何更加清楚地认识投资者情绪对市场产生的冲击,正确理解和准确预测市场的情况,减少投资者在市场中的非理性行为,是促进当前中国股票市场有序运行与健康发展的重点。同时这也是当前学者们及相关机构的研究方向。Fama-French三因子模型是早先资产定价领域的
学位
在万物皆媒的传播生态下,以短视频为代表的新型媒体形式,正在逐渐走向主流。其直观的表达和分享方式迎合了新生代的媒介使用偏向,成为人们获取新闻资讯的重要途径。2020年,新型冠状病毒席卷全球,人们都充斥在惊恐和焦灼的情绪当中。央视新闻抖音号自1月20日首次发布疫情短视频以来,每日爆款视频平均点击量达一百万,成为最具传播力的新冠肺炎舆情阵地之一。它用独特的情感话语和表达方式向公众呈现疫情的实时动态,传递
学位
目的 应用蛋白质组学方法探讨仙连解毒方(Xian-Lian-Jie-Du Decotion,XLJDD)治疗小鼠结直肠癌湿热瘀毒证模型的作用靶点及信号通路。方法 采用偶氮甲烷(AOM)/葡聚糖硫酸钠(DSS)结合高糖高脂饲料喂养的复合方法建立小鼠结直肠癌湿热瘀毒证模型,将小鼠分为空白对照(Control)组、湿热瘀毒证模型(Model)组、仙连解毒方处理(XLJDD)组。XLJDD组于造模同时开始
期刊