基于机器学习的评论文本分析

来源 :安徽师范大学 | 被引量 : 2次 | 上传用户:aujnqejbrob
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人民群众的物质财富已经获得了极大的丰富,外出旅游成为大众追求精神财富的一种流行形式。游客在出行前可以通过在线平台完成酒店预订,他们会阅读过往游客发表的体验评论来给自己提供意见参考。酒店本身也会密切关注那些评论,从中发现提高自身服务水平的立足点和着力点。评论信息杂乱且数量巨大,通过人工阅读的方式无法准确而全面地了解酒店情况。使用机器学习技术对评论文本进行精确分类并对其中蕴含的信息进行挖掘就显得极具意义和价值。本文立足于文本分类和LDA主题模型的相关理论,对某品牌酒店的评论文本进行实证研究。首先,数据的收集是基于网络爬虫技术完成的,通过数据清洗、中文分词以及文本向量化完成数据的预处理。对完成预处理的数据作了描述统计说明。其次,构建了逻辑回归、支持向量机、随机森林和人工神经网络四个分类器模型,计算召回率、精确度和AUC值等指标来评价它们的实际性能。支持向量机模型表现最好,可以在线上进行推广,用于实现对该品牌酒店评论文本的精确分类,弥补一些平台完全没有考虑将评论文本进行分类或者分类效果不佳的缺陷。最后,在正向评论类别和负向评论类别中分别构建LDA主题模型,挖掘潜在主题,提取不同主题对应的特征词进行对比分析。正向评论和负向评论的关注点主要集中在地理位置、设施配套、房间大小和隔音效果等方面。基于从评论文本中挖掘到的潜在信息,为出行游客和该品牌酒店提供针对性的意见和建议。
其他文献
为了解金沙江攀枝花江段产漂流性卵鱼类的早期资源现状,2016-2018年6-7月在攀枝花市银江镇开展了鱼类早期资源调查。结果显示:该江段现有产漂流性卵鱼类7种,分属1目3科,其中
目的研究Mini Uni-Twin系统在正畸排齐阶段的应用。方法选择牙弓对称的恒牙初期减数4颗第一前磨牙的患者10名。随机选择左右一侧上下牙列为试验侧,粘结3MMini Uni-Twin矫治器
随着医疗器械全球化进程的加快,本地化是必不可少的过程,本地化最核心的问题就是对某个国家或地区语种和使用习惯的支持。该文首先对BT2000工作原理进行探讨与研究,构建了虚拟机
目的:了解综合性医院心理门诊来访者的心理状况,并探讨其人格特点与心理健康状况的关系。方法:对2008年12月至2010年12月期间到广东省人民医院心理门诊就诊并接受MMPI测试的995
<正>近年来,随着我国经济社会的发展与行政体制改革的推进,政府购买服务越来越受到各级党委政府的重视与社会公众的关注,一些试点城市购买社会工作服务项目的探索与实践不断
为了探讨超声波对反复冻融鸡肉肌原纤维蛋白(myofibrillar protein,MP)功能特性的修复作用,采用超声波功率为420W,处理时间分别为0、3、6、9、12、15、18min,测定MP的功能特
目的 比较关节灌洗、关节镜和关节开放手术 3种方法治疗颞下颌关节紊乱病的临床效果。方法 应用 3种方法治疗颞下颌关节紊乱病 :关节灌洗术治疗 35例 (42侧关节 ) ,关节镜
本研究根据批判教育学理论视角,将教学过程中的课堂对话以及教师用语当作研究对象,发现“隐性辍学生”在课堂中遭遇的不公平事实,以及学校是如何追求高升学率而忽视大部分学
<正> 我国大学生心理咨询工作起步于80年代中期,发展于90年代。随着我国全社会心理卫生运动的发展和心理咨询活动的开展,随着1990年全国大学生心理咨询专业委员会的成立及许
<正>《全球化与后现代教育学》由大卫·杰弗里·史密斯(DavidGeoffrey Smith)著、郭洋生译,教育科学出版社出版。本书是作者近几年从事研究的一些论文结集,这些论文在全球化