论文部分内容阅读
随着电商产业的迅速发展以及电商网站服务平台的构建和不断完善,平台上每天都会产生大量与商品或服务相关的消费者在线评论。而这些评论中所蕴含着的丰富的内容信息无论是对商家还是挑选商品或服务的消费者来说,都有很大的利用价值,是网购消费者选择商品或服务以及商家提升和改进自身产品与服务的重要参考。但面对海量的在线评论文本数据,通过人工阅读的方式来获取评论中有价值的信息是不现实的。故本文基于中文文本挖掘的理论知识和相关技术,以旅游在线评论数据为例,利用R软件以及ROST CM6软件对评论文本数据进行了挖掘分析,旨在迅速而准确地提取出评论文本数据中有利用价值的关键信息,提高网络在线评论文本数据的利用价值。同时,本文的研究工作也为网络在线评论文本数据的挖掘分析提供了一个可供参考的思路。本文运用的中文文本挖掘方法主要包括语义网络分析、主题模型和情感倾向性分析。首先本文通过高频词的相关性度量以及语义网络分析对文本数据进行初步的挖掘分析,对评论文本数据中的关键信息进行了提取;接着通过主题模型建模分析,实现了评论文本数据的主题词提取以及评论的主题分类,从而更加直观且迅速获取到评论内容中不同类别的信息;然后利用情感倾向性分析的方法实现了评论文本数据的情感分类,对情感极性错误的评论进行识别分析;最后本文还将情感倾向性分析与主题模型相结合,通过对情感倾向性分析的结果进行主题建模,实现了游客对于景区内各项服务的情感倾向性判断。此外,本文还将文本挖掘分析的结果与实际相结合,分别对游客选择旅游景点、制定出游计划以及景区提升和改进自身设施及服务、制定精准的营销服务策略提出了一些参考性建议。