论文部分内容阅读
近年来,电子商务的迅速发展和不断普及,使消费者的消费习惯发生了深刻而巨大的变化,相当一部分消费和交易行为由线下转移到线上,网络交易规模不断扩大。2017年,中国网络零售市场交易规模达7.2万亿元,截至2018年12月,我国网络购物用户规模达6.10亿。消费者可以通过电商平台发表自己对于所购买商品的评价,从而产生了大量评价信息,这不仅为其他消费者的购买提供了参考意见,同时也为商家提供了很多宝贵的信息。潜在消费者可以通过线上用户评价信息,全面而详细的了解所关注的商品或服务,并进一步做出是否购买的决定;而商家可以从评价信息中,了解到消费者的消费习惯、兴趣特征和消费意向,从而改善产品和服务,提升企业竞争力。因此,研究分析用户的评论数据意义重大。文章运用了 LDA主题模型和情感倾向分析两种文本挖掘方法,以小米京东自营旗舰店中小米8手机为例,对评论文本进行深入分析。具体内容为:第一,利用网络爬虫技术实现手机评论文本的获取,经过分词、去停用词等步骤实现数据预处理。第二,运用LDA主题模型将所有评论文本归为20个主题,了解到用户对于小米8手机的关注点主要有购物体验、手机性能、手机价格、品牌对比、手机功能、手机外观、手机配置、包装赠品八个方面。第三,基于情感词典进行评论语句的情感倾向分析,计算每一条评论的情感得分,并根据情感得分将评论文本划分为正面评论、中性评论和负面评论,然后运用LDA主题模型,分别提取正面评论主题和负面评论主题,发现用户对小米8手机的价格、品牌、功能和配置以及京东的物流速度是持正面评价的,而对于京东商城的售后服务及快递配送、小米8手机的电池续航能力以及上网流畅性持负面评价,同时对于手机保价服务也提出了要求。最后,根据得出的结论分别对京东平台和小米手机供应商提出相应的建议。