论文部分内容阅读
近年来,我国互联网技术迅猛发展,各种电子商务网站也如雨后春笋般,不断兴起。电子商务网站的兴起,对人们的购物模式产生了很大的影响,选择通过电商网站购物的用户越来越多。截至2016年6月,我国网购的用户数量已经超过4亿。通过电子商务网站购买商品的方式不仅为用户节省了时间和成本,而且消费者可以通过电商网站发表自己的言论,这不仅为其他消费者的购买提供了参照意见,同时也为商家提供了很多宝贵的有用信息。为了提高用户的商品体验满意度,研究分析用户的评论数据意义重大。面对信息量几何增长的电商评论文本信息,我们需要借助文本挖掘技术,自动化的处理海量的数据。中文是一门博大精深的语言且极其复杂,因此挖掘中文评论文本中的潜在信息是自然语言处理(NLP)领域的研究难点,同时还涉及到机器学习和人工智能等多个领域。本文依据电商满意度影响因素和网络文本挖掘的研究现状,借鉴已有的研究成果,以华为京东自营官方旗舰店mate9手机评论数据为例进行研究,将文本挖掘技术应用到电商满意度影响因素的研究领域。首先应用网络爬虫技术自动抓取华为京东自营官方旗舰店mate9手机3000条商品评论数据,对抓取的数据依次进行噪声处理、jieba分词、去停用词;其次从数据处理结果选出特征词,并采用k-means聚类算法,对特征词进行聚类,聚类结果及为用户满意度影响因素;最后,构建词典依次对用户满意度影响因素匹配赋值打分,根据实验结果对京东商城和华为手机供应商提出相应的建议。本研究可以快速及时的从用户评论数据中抽取出用户满意度影响因素,可以为企业决策者提供及时有效的参考意见,同时也是文本挖掘技术应用的一种创新,相信随着文本挖掘技术的革新,会给商业带来更大的价值。