基于Bi-LSTM的在线西藏旅游和饮食评论情感分析研究

来源 :西藏大学 | 被引量 : 0次 | 上传用户:caolippp123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代化技术的迅速发展,互联网已成为实现人们进行交流的最重要的一个途径。越来越多的互联网用户通过网络的途径来表达自己的观点和对周边发生事情的看法。例如用户从网络平台购买产品,并表达对产品的看法,或者政府发布一些政策,人们也可以通过网络来表达自己的观点。通过将这些数据收集、分析,获取民众的情感倾向性,这些情感倾向性数据有利于商家更好的去分配商品在市场上的比例,政府可以依据这些数据的合法性,去进一步完善政策内容并满足民众的实际需求。因此,研究文本的情感分析变得越来越重要。目前,情感分析主要应用于舆情分析、商家产品口碑等等方面。西藏作为中国著名的旅游胜地,每年都有很多来自中国内地的游客来西藏游玩以及品尝西藏本地的美食,因此研究内地游客对其旅游景点以及当地的饮食评价的情感分析是非常有价值的。深度学习是学习数据之间的关联性,并将这些信息应用到研究任务中,这些学习获取到的信息能够很好应用于语音、文字和图像等领域。目前深度学习方法在自然语言处理方面取得了非常不错的成果,因而受到越来越多人的青睐。相较于传统情感分析过于依赖人工建立的情感词典以及人工选择特征的弊端,尤其是大数据时代的来临,需要处理的数据规模越来越大,传统情感分析需要耗费大量的时间以及对文本分类的结果很难有进一步的提高,深度学习在这些方面上有很好的改善。本文分别研究了卷积神经网络(CNN)和双向长短期记忆网络(Bi-LSTM)的情感分析,并结合两者提出基于CNN+Bi-LSTM模型的情感分析方法。本文完成的主要研究内容如下:1)利用Python技术在互联网上收集有关西藏旅游业以及饮食业的评论文本,构建了20,000条数据集,分为积极情感语料13,000条和消极情感语料7,000条。2)采用Jieba分词系统对收集的数据进行分词,并结合Word2vec词向量技术中的CBOW按照一定的距离在这些词上滑动并训练得到每个词的词向量。3)在以上工作的基础上,提出基于Bi-LSTM模型的情感分析,实验结果表明有效提升了情感分类的准确度。4)为了进一步提高效果,将CNN提取文本词向量的关键信息与Bi-LSTM提取的文本时序序列特征相结合,提出CNN+Bi-LSTM模型的情感分析方法。5)分别验证了SVM、CNN、Bi-LSTM和CNN+Bi-LSTM模型,其中CNN+Bi-LSTM模型的准确率达到94%。
其他文献
酯类广泛应用于香料、医药、粘合剂等领域。其中应用最为广泛的酯类之一为甲基丙烯酸甲酯(Methyl methacrylate,MMA)目前,MMA主要采用丙酮-氰醇法生产。该方法是多步骤合成过程,反应过程中产生酸或其衍生物,它不仅腐蚀设备,而且产生大量副产品;异丁烯氧化的三步法反应流程长且经由甲基丙烯酸,对设备要求更高。因此,开发一条绿色高效的MMA生产线具有重大的意义。在不添加任何有毒或腐蚀性化合
随着自然科学与工程技术中许多非线性问题研究的不断深入,出现了很多不均匀材料,如电变流体、弹性力学以及图像恢复等,经典的Sobolev空间不再满足需要,变指数函数空间的出现
师生言语互动是指在课堂教学情景中,教师和学生运用言语或者非言语的形式进行的相互感知与影响。通过对师生互动整个过程的探究,不仅能了解到教师实现教学目标的程度,还可以
MEMS加速度计常用于航空航天、石油勘探等领域测控系统的振动与惯性测量中。为了确保加速度计测量信号的准确性和有效性,需要根据国家计量检定规程定期对其进行校准。现有的
目前对于纳米粒子在液-液界面自组装构建结构化液滴进行全液相3D打印的研究,主要集中于水油两相体系,存在生物相容性差等问题。本论文以环境友好及生物相容性优异的双水相系
TlGaS2是一种新颖的准二维层状材料,由于具有独特的能带结构,TlGaS2在可见光和x射线范围内具有较高的光敏性,这使得它在光电子器件中有重要的应用前景。目前,TlGaS2的光学和电学性能已经得到了广泛的研究,但其超快非线性光学性质的相关研究还没有被开展。为了更好地将TlGaS2应用于光电子器件中,对TlGaS2的超快非线性光学性质的深入研究是十分必要的。为此,我们开展了 TlGaS2超快非线性
随着5G移动蜂窝网络和自动驾驶技术的不断发展,智能交通系统(Intelligent Transportation Systems,ITS)正逐渐成为技术创新和产业发展的重要领域。为了促进交通系统的智能化
随着中国经济、科技和教育的快速发展,高等院校对于高层次人才的需求日益强烈,高层次人才与高校之间的作用日益显现,高校间的人才竞争愈发激烈。与“双一流高校”和中央部属
轨迹数据的频繁模式挖掘旨在从大量的轨迹数据中挖掘出用户频繁访问的具有一定顺序的区域集合,是一系列基于位置服务的应用基础。语义轨迹具有体积小、质量高、更能反映用户
β-胡萝卜素是最具营养的天然色素之一,抗氧化性强,三孢布拉霉等微生物发酵法生产β-胡萝卜素是目前最具潜力的方法之一,但其产量还不能满足工业化生产需求。本文利用脉冲磁场技术诱变选育三孢布拉霉菌株,以期获得β-胡萝卜素高产菌株,对比研究出发菌株与高产菌株特性。主要研究结果如下:(1)采用脉冲磁场技术诱变选育获得高产菌株。当脉冲数为9,磁场强度为7 T时,诱变效果最佳,诱变菌株的β-胡萝卜素最高产量可达