基于古诗词的主题情感分析的研究与实现

来源 :南昌大学 | 被引量 : 0次 | 上传用户:qwe6367
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
古诗词作为中华文化中的瑰宝,不仅在当代人文化建设中反映他们的精神生活,而且对现代人的情操陶冶和文化修养有重要帮助,因此,古诗词的研究价值是不容小觑的,也具有长远的研究意义。随着信息时代的快速发展,越来越多的学者开始研究自然语言处理领域的相关工作,数据的处理也用现代计算机智能化技术来取代传统的手工。文本分类技术作为自然语言处理的经典问题之一,能够有效对海量文本数据进行自动归类,虽然已在现实生活中有广泛的研究与应用,但将其用在古诗词上的研究并不多。本文主要对古诗词在情感分类和主题分析两个部分进行研究,主要工作与创新点如下:(1)对于同一个句子在表达语义上,古文与现代文是有明显不同的,分词作为文本处理进行分析的第一步也是关键的一步,所以为确保古诗词的字和词语义向量能有效划分,本文提出采用甲言工具包,它是一款专门针对古汉语处理的NLP(Natural Language Processing)工具包;(2)本文中情感分类的数据集采用的是清华大学人工智能所提供的中文诗词情感分类公开测评数据库,根据古诗词自身特点,总结和整理了现有的情感词汇资源对古诗词进行情感倾向的判断,模型的精确度达到78%;(3)主题分析的数据集是应用爬虫技术采集诗词网站诗词归纳的数据,并对数据集进行类别标记。本文研究了Text CNN(Text Convolutional Neural Networks)、LSTM(Long Short-Term Memory)和Attention机制等多种深度学习模型,并使用了多种不同结合的网络结构模型,期望获得更好的分类结果,并通过实验证明,Text CNN、Bi LSTM和Attention机制结合的模型的准确率最高达到71.24%,在一定程度上可以提高主题分类效果;(4)本文将古诗词的情感分析问题和主题分析问题归结为分类问题进行研究,并在上述的研究基础上,本文建立了一个基于古诗词的主题情感分析系统,该系统主要包括主题分析模块、情感分类模块、查询模块、历史记录模块和用户管理模块五个模块。
其他文献
我国作为全球最大的商用车市场,随着全球经济化愈演愈烈,我国商用车行业面临巨大的机遇与挑战。若要在这样激烈的竞争环境中获得明显的竞争优势,企业向数字化信息化转型是必经之路。由于商用车定制化程度较高,要求企业对于整车售前及销售过程的管理具有合理的信息化管理手段。售前管理的目的在于挖掘客户,而CRM以客户为核心,帮助企业实现以客户为核心的管理模式,CRM系统可以有效地解决目前企业售前管理困难的问题。但是
研究发现人体不同的意识活动能够产生相对应的脑电信号。脑机接口是根据这个特征设计的一种设备,能够将大脑意识活动直接传达至外界,因此有着重要的应用价值。但是由于脑电信号具有复杂性、低信噪比等特点,对其进行特征提取以及分类检测的模型仍存在一些不足,例如相关模型在准确率等评估指标上需要进一步提高。深度学习模型能够自动提取特征,更适用于复杂的脑电信号数据。针对运动想象脑电信号、P300脑电信号,设计了多种数
为确保铁路列车通过站线及停靠站台时不发生剐蹭,同时保障旅客上下车的安全,需定期检测并严格控制铁路站台的限界尺寸。目前使用最多的方法为量尺类接触式检测,检测效率低,受人为因素影响较大。本文采用双目视觉技术,研究了一种非接触式站台限界测量系统。根据站台限界的测量需求,本文对所涉及的双目视觉相机进行了选型,采用张正友标定法对双目视觉相机的镜头畸变进行了矫正,并获取了双目视觉相机的内参矩阵与外参矩阵。同时
随着经济和社会的高速发展,城市发展的脚步亦不断加快,“垃圾围城”也成为了城市环卫工作的紧迫问题,传统的管理体系和监察方式已很难满足日益增长的环卫需求,因此国内各大城市都对智慧环卫进行了积极的探索和实践,但智慧环卫云平台的研究仍然存在数据孤岛、感知层硬件设施效率不高等实际问题。本文针对目前智慧环卫云平台发展中存在的垃圾分类效率低、政府和企业数据共享不充分等问题进行研究,使城市环卫工作进一步精细化、高
食用农产品是人们日常生活饮食中的必备食品,而食用农产品质量安全问题则是当今社会最为关心的民生问题。近年来农产品质量安全问题频发,使得消费者的权益受到损害,同时也有损农产品生产者的信誉和形象,而传统的中心化的溯源系统的数据易被篡改,无法提供有保障的真实溯源信息,因此使用区块链技术来构建数据安全不易篡改的农产品溯源平台具有重大意义。本文主要研究内容如下:(1)阐述了国内外农产品溯源体制的发展现状以及区
在光照条件不佳的环境下,由于曝光不足,光学成像设备所收集的图像整体视觉暗淡、细节模糊、可见性差,必须经过增强处理后才能用于后续的各类图像处理任务。现有的低照度图像增强(low-light image enhancement,LLIE)算法大多数是基于Retinex的光学物理模型,所得到的图像整体上视觉效果较好,但估计照射分量或反射分量时受约束的限制很容易导致图像出现局部细节模糊等问题。近年来,基于
随着多媒体处理和互联网技术的飞速发展,以图像为主的信息传播越来越多,因此,图像传输和储存的安全性受到了人们的关注。为了保护图像信息不被未经授权的复制和传播,并满足实时安全图像信息传输的需求,图像加密应运而生。本文设计了两种基于混沌系统和DNA计算的图像加密方案,并对其性能进行了测试。具体研究工作如下:(1)提出了一种基于新型时空混沌和DNA计算的彩色图像加密方案。该方案利用蔡氏电路产生的伪随机序列
近年来,各省社会经济快速发展,交通运输需求增长迅猛,使公路管理部门在公路运输保通保畅工作上面临着巨大挑战,对公路主管部门在路网运行管理与应对突发事件的能力提出了更高的要求。为此,本文以公路交通管理为目的,结合目前国内外在交通应急管理方面的先进经验,综合应用分布式技术、大数据处理技术、视频监控技术、深度学习与Java EE技术设计开发了公路管理和预警平台,在满足实际需求的前提下实现便捷化交通管理。平
由于软骨愈合能力差,骨软骨(OC)缺损自修复能力有限,现在临床上并没有显著有效的药物促进骨软骨缺损愈合,因此OC修复需要手术,组织工程支架被认为是骨软骨再生手术中有前途的材料。由于OC缺损通常涉及对软骨和下方软骨下骨的损害,因此组织支架在细胞组成、生长因子、材料组成、结构、力学性能和稳定性方面必须具有离散梯度或连续梯度。为了满足OC修复支架的要求,本课题采用冷冻3D打印气动挤出技术成功制备了CS生
随着中国人民物质生活愈发丰富,精神追求也愈发提高,健身需求愈发强烈,全国健身工作室雨后春笋般的建立起来,但面临着健身教练不专业,门面租赁贵,成本高,抗风险能力弱等困境,传统健身行业渐渐衰弱。在线健身行业逐渐崛起,但处于信息大爆炸的时代,如何从海量的健身知识里面选取最适合的健身信息也是亟待解决的一大难题。推荐系统能够解决信息过载,将信息过滤过程从“用户主动寻找”转变为“系统主动推送”,解决用户当前困