论文部分内容阅读
面对网络上日益丰富的评论信息资源,如何能快速有效的获取并使用其中的有效信息成为人们关注的问题。本论文研究目标是互联网上的旅游评论,通过使用数据挖掘算法分析获取评论中关于商品或服务的特征词,并提取所有评论中包含特征词的句子。利用LingPipe方法和PMI方法来分析这些特征句的情感倾向。并利用LingPipe方法和统计分析方法分析影响旅游评论有用性的因素。本文首先系统地介绍了旅游电子商务的相关知识。通过对旅游电子商务的基本概念和分类的介绍,总结了旅游电子商务的发展现状,并提出了旅游电子商务的发展趋势,为下一步的研究奠定基础。随后论文对文本分类和文本情感倾向分析的来源及原理作了简要地总结,介绍了几种主要的文本情感倾向分析分类的方法。在实验阶段,首先论文分析的是携程网上关于酒店的情感倾向性分析。论文本部分的研究目的是获知评论者对于某种产品或服务的某一特征的情感倾向。首先利用数据挖掘算法获得关于酒店评论者关注的特征词,并利用程序获得包含这些特征词的句子。然后论文通过使用LingPipe方法和PMI方法来分析关于某一特征的情感倾向,并根据实验过程和分类性能将两种方法进行比较。在第二部分研究中,本文主要分析了影响互联网上旅游评论有用性的因素。搜集整理了yahoo英文中旅游频道上的关于旅游目的地的评论,利用LingPipe方法获得评论中的主、客观特征值,建立固定效应对数线形回归方程和其改进模型分析得出主观、客观相交融且比较长的评论感知有用性最强。本研究可以快速地从海量评论中获得评论者对于某一产品或服务的某一特征的正负面评价,能更为有效地辅助阅读者的决策。且可以了解什么样的评论对阅读者帮助最大,相信本研究在未来能够得到很好的实践应用。