论文部分内容阅读
一直以来,虚假评价的泛滥严重制约着我国电子商务的发展。虚假评价会误导消费者,致使他们做出错误的决策,甚至会给他们带来经济上的损失,因此识别出在线购物网站中发布虚假评价的用户有着重要的现实意义。针对这一现状,本文基于电子商务网站中水军用户与非水军用户之间的特征差异构建了一套虚假评价用户的识别方法,通过该识别方法,能够有效地发现网站中发表虚假评价的水军用户,从而为消费者提供一个良好的信用环境。本文基于向量表示方法研究了C2C电子商务用户的特征模型,深入分析了买家和卖家用户在虚假评价过程中关注点的差异,分别构建了基于信用级别、评价及时度、控制度等7个维度的买家特征模型和基于信用级别、好评度等4个维度的卖家特征模型。以淘宝网数据为例,分别对买家用户中的水军用户与非水军用户之间、卖家用户中的不良商家与诚信商家之间的特征差异进行量化分析,建立不同特征下的累积分布图,进而基于水军用户与非水军用户、不良商家与诚信商家在这些特征上存在的不同程度的差异给出这些维度的权重,为虚假评价用户的识别奠定基础。基于买家用户之间以及卖家用户之间在用户特征上存在差异,本文提出了基于用户特征的虚假评价用户识别方法。首先,根据卖家用户之间的特征差异进行异常分析,可以优先识别出可能包含虚假评价用户的候选商品集。接着,根据买家用户之间的特征差异对候选商品集中的买家进行相似度分析并基于此构建出用户的相似度网络,对该相似度网络进行小团体分析后,得到一个由水军团体及非水军团体组成的集合。最后,利用水军用户与非水军用户在共同评价商品数量上的差别,即可识别出该集合中的水军用户和非水军用户。实验表明本文提出的方法具有良好的识别效果。