OTA网站评论文本的情感分析研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:ciha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的发展,人们对旅游的需求不断增加,使得在线旅游消费市场呈爆发式的增长。因此,以携程网、去哪儿网等为代表的旅游OTA网站积累了海量的用户的评论文本数据。如何从这些大量的文本数据中获取有用的信息以提高用户体验成为亟需解决的问题。本文针对OTA网站评论文本数据进行了情感分析研究。具体工作如下:首先,本文通过网络爬虫技术抓取了一定量旅游OTA网站的评论文本数据作为研究对象并构建了相应的分类词库以及情感词库。由于旅游OTA网站评论文本的特殊性,目前的一些开源的情感词库不能十分有效的匹配该类评论文本数据,而且主流的情感词库大部分是二分类的情感判别,无法体现用户具体的情感倾向程度;也不能将用户的情感倾向按评价要素细分或者按用户偏好个性化获取情感倾向程度。基于此本文针对该类评论文本数据重新构建了专有的按评价要素细分的分类词库以及情感词库。从而能够更有效地获得用户的情感倾向值。同时也是本文模型构建中不可或缺的一部分。其次,本文提出一种基于LSA(潜在语义分析)与DBN(深度信念网络)的深度学习模型。由于传统的基于文本向量空间所构建的文本特征矩阵仅仅体现了文本信息中词频的信息,而未能包含词语于词语之间潜藏的语义信息(如:一词多义或一义多词等)所以在模型拟合过程中其效果往往有所欠缺。因此,本文运用LSA方法将原始的文本特征矩阵进行SVD分解,再通过合理的选取分解后奇异值的个数重构文本特征矩阵。最后,基于重构后的文本特征矩阵构建了DBN的深度学习模型以期通过对文本数据的训练学习能够有效地获得文本的情感倾向值。最后,本文还设计了六组数据与模型的对比实验以验证模型的有效性。从最终各个模型十折交叉验证的总体对比结果来看,本文构建的基于LSA(潜在语义分析)与DBN(深度信念网络)的深度学习模型具有较好的性能。
其他文献
针对一类未知非线性系统 ,提出了一种输出反馈控制方法 .首先 ,在假设系统状态已知情况下设计状态反馈控制器 ,实现跟踪性能 ;然后 ,在系统状态不完全可测的情况下 ,通过设计
本文主要介绍了用VC++绘制位图按钮的方法和实例.
期刊
2014年10月,正值金秋收获时,中国的航空航天事业喜获丰硕成果,承载着中国亿万人民探月梦想的“小飞” (CE-5T1飞行试验器)在太空中纵身一跃,出色地完成了中国航天专家特别定
期刊
采用统计分析和情景模拟法,将黄土丘陵区损毁耕地程度划分为:轻度、中度和重度。在三种沉陷后地形坡度下进行单体工程设计,得到损毁耕地在不同情景下复垦静态亩均费用:
2000年以来“公务员热”的火爆程度与日俱增,与上世纪90年代的“下海热”形成了鲜明的对比。CHNS数据显示,2000年之前,国有部门的平均工资低于非国有部门;而在2000年国有部门与非
长期以来,各级纪检监察机关主要是以书面审核的方式审理党政纪案件,有时会出现对被审查人自身合法权益保障不足的问题,个别违纪人员被处理后往往不能心服口服,甚至产生抵触情
社会保障问题是近年来我国关注的热点问题,社保制度是维护社会稳定与公平的重要制度,不论是劳动者还是用人单位,都应当积极履行参加社保的义务.实践中,越来越多的用人单位和
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
期刊