基于有用性排序的在线评论与销量的关系研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:aheoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:[目的/意义]从海量的购物评价筛选出高效用的评论文本,既能为潜在用户的购买决策提供有价值的参考,也能为电子商务经营者提供巨大的商业价值。[方法/过程]通過量化在线评论的有用性指标,以模糊层次分析法确定属性权重,依据灰色关联分析法进行在线评论有用性排序,并基于有用性过滤评论,探究在线评论对销售绩效的影响。[结果/结论]差评的各项指标相比好评来说具有明显优势,有用性更高。评论总数、评论时效性显著促进产品销售。情感倾向对搜索型商品的销量的影响并不显著。
  关键词:在线评论;产品销量;评论有用性;模糊层次分析法;灰色关联分析法
  DOI:10.3969/j.issn.1008-0821.2019.02.018
  〔中图分类号〕F713.36〔文献标识码〕A〔文章编号〕1008-0821(2019)02-0152-09
  互联网的迅速发展推动以网络为载体的口碑传播飞速增长,在线评论作为口碑传播的一种新形式得到发展和完善,并逐渐成为消费者寻求产品信息的重要资源[1]。购物评价能够有效降低消费者在信息不足时购物的风险,还可以帮助消费者制定购买决策。BrightLocal[2]调查发现,85%的消费者认为在线评论与个人推荐的可信度较高。越来越多的企业利用在线评论作为新的营销工具,积极引导消费者进行产品传播,促进产品销售,甚至操纵在线评论以影响消费者的购买决策。但在线评论的研究范围广泛,涉及不同领域,以及研究方法、模型、数据选取等原因,已有研究显示在线评论对销售绩效具有一定的影响,但尚未得出一致结论[3-4]。而且信息过载的环境下,消费者需花费大量时间和精力判断评论信息的真伪和有用性。当前多数电子商务网站,如淘宝、京东、亚马逊等,一般是将“有用性投票”和“评论时间”作为在线评论的排序指标[5],但具有一定的片面性,加之大量虚假信息和垃圾信息造成的干扰,使排序结果造成不同程度的失真,降低在线评论的参考价值,从而影响网购市场的健康发展[5]。
  本文综合前人的研究成果,挖掘在线评论文本信息,综合考虑评论有用性指标,并进行量化,以模糊层次分析法确定属性权重,依据灰色关联分析法进行在线评论有用性排序,并基于有用性过滤评论,探究在线评论对销售绩效的影响。从海量的购物评价筛选出高效用的评论文本,既能为其他用户的购买决策提供有价值的参考,也能为电子商务经营者提供巨大的商业价值。
  1文献综述
  2001年,Chatterjee P[6]首次提出在线评论这一概念。早期多集中于其内涵要素及对购买意愿的影响研究,近几年在线评论的有用性分析成为热点。有用性是指在线评论是否影响消费者决策的一种主观感知[7],能够减少消费过程中的不确定性,为购买决策提供参考依据。目前在线评论有用性的相关研究包括影响因素、有用性排序以及对产品销售的影响等。
  1.1在线评论有用性影响因素研究
  国内外学者探讨在线评论有用性的影响因素,多集中于评论可信度、评论极性、产品类型、评论长度、评论时效性、评论文本特征等要素。Liu等[8]基于因素分析法,提出评论时效、文字风格及评论者经验是影响因素。殷国鹏等[9]基于社会网络分析豆瓣电影评论,证明评论长度、评论星级、评论者中心度与评论有用性存在相关关系。Mudambi S M[7]、Pan Y等[10]、Scholz M等[11]、Ghose A等[12]、Chen Y等[13]均发现评论极性、产品类型、评论长度、评论时效性能够影响有用性。Ghose A等[12]、卓四清等[14]等认为投票数也对在线评论的有用性起到调节作用。Scholz M等[11]、Cao Q[15]等人提出评论的文本特征也存在影响,例如标题长度、评论可读性、字词错误率等。
  1.2在线评论有用性排序研究
  李志宇[16]、陈市等[17]均通过模糊层次分析法对在线评论有用性进行排序。蔡晓珍等[18]、吕韶华等[19]利用多元线性回归法构建模型,对评论的有用性进行自动判断。王倩倩[20]以信息采纳模型为基础,将文本型评论与数值型评论的一致性进行量化,对淘宝中的在线评论按照可信度大小进行排序。郭顺利等[21]以美团的用户评论为量化数据,采用模糊层次分析法和加权灰色关联分析方法进行在线评论有用性的计算和排序。张艳丰等[5]以模糊层次分析法确定指标权重,提出一种量化用户评论属性的模糊TOPSIS可信度排序方法。
  1.3在线评论对销量的影响研究
  在线评论能够减少交易过程中的信息不对称,从而影响消费者的购买决策,但在线评论是否能够代表消费者真实的消费体验一直存在争议。Chevalier J A等[22]、Chintagunta P K等[23]、卢向华等[24]学者分别通过对图书、电影、酒店预订等领域的在线评论进行研究,认为越积极的评论越能够产生更大的说服效应,推动产品销售绩效,并且Shen Y等[25]、宁连举[26]等人均表明极端情感倾向的在线评论对消费者的感知会产生更大的影响,且负面评论大于正面评论的影响。甚至Ghose A等[12]、Thelwall M[27]等人通过对冷门书籍、Twitter事件的传播进行探究,表明负面的在线评论能引起一定的宣传作用,从而增加销售量。但杨雅秀[28]、张心悦等[29]、Duan W等[30]学者的研究不支持评论效价对产品销量的作用。除评论效价外,Duan W[30]、李健[31]、龚诗阳等[32]学者认为销售量极大地受在线评论数量的影响。此外,近年来学者们也开始从影响的调节变量角度进行检验,例如产品类型[33-34]、消费者心理表征因素[35-36]等。
  总体而言,目前国内外学者大多通过对不同平台、产品的在线评论数据,对评论有用性和产品销量的影响因素分别进行研究,但利用有用性对评论进行排序和筛选的研究较少,并且针对在线评论对产品销量的影响研究尚未得出普适性结论。本文以多种类产品探究高有用性评论的自身特征以及对产品销量的影响效果,进一步降低用户搜寻有用评论的成本,帮助企业了解在线评论对产品销量的影响机制。   2研究思路与数据
  本文归纳、改进前人研究结果[5]构建硏究模型及选取变量,采用Python爬虫获取模型分析所使用的在线评论数据、产品销售数据及产品特征數据,选取计算评论有用性的6个常用指标进行有用性排序。基于有用性过滤评论,探究在线评论对销售绩效的影响,并利用回归分析对相关模型进行估计,验证相关假设。研究思路如图1。
  2.1数据获取
  研究样本源于亚马逊中国,2018年中国电商网站排名位于第四名[37],具有一定的客户基础。亚马逊是最早推出消费者在线评论系统的电子商务公司,评论机制较为完善,且评论质量较高[38-39],并提供产品的销售排名信息,可满足样本要求。
  数据抓取时间为2018年4月5日至2018年4月15日。本文选取亚马逊的电子产品、母婴用品、办公用品、小家电、个护健康、图书、影视/教育
  音像、汽车用品等8个品类中销售排行榜前100名的产品,抓取每个产品的产品信息及评论信息,剔除无评分、无评论数的产品数据信息,共745个产品,286 350条评论。采集数据包括ASIN(商品ID)、产品名称、产品价格、销售排行、评论数量、总评论星级、各评论星级的评论数量;每条评论的星级、标题、评论者ID、评论者昵称、评论时间、评论有用数、评论内容。
  2.2评论有用性排序研究方法
  2.2.1评论有用性排序研究框架
  对初始评论集合进行提取,以评论者信息披露、评论时效性、评论有效长度、有用性投票、产品属性特征词、情感特征词作为评价指标层,量化各属性值并构建评论特征矩阵,利用模糊层次分析法对不同指标赋予权重,依据灰色关联分析法进行在线评论有用性排序,如图2所示:
  2.2.2指标量化
  信息披露程度利用评论是否匿名进行量化,匿名评论数值为0,实名评论数值为1。
  评论时效性通过阅读时间Tr与发表时间Tw的差值进行量化,考虑数值过大造成的偏差,设置参数σ使评论时效区间在合理范围,本文评论时效
  性计算公式如:Time=[365-(Tw-Tr)]/σ,取σ=36.5,Time的取值范围为[0,10]。
  评论中含有大量与产品无关的信息,本文采用在线评论的有效长度进行量化,即在线评论中的情感词Ns和产品属性词No与评论长度Nt的比值,运用对数弱化评论过长或者过短造成偏差,即Lcontent=(lgNs lgNo)/lgNt。
  亚马逊中在线评论的有用性投票含有具体数值,以有用性投票数来量化评论有用性指标。
  评论的情感极性通过评论标题及正文中的情感特征词的数量进行量化,以台湾大学的简体中文情感极性词典NTUSD[40]及大连理工大学的情感词典[41]相结合作为情感词典。将待排序的在线评论进行分词处理,并与情感词典进行匹配,统计匹配成功的词语个数,作为情感特征词的量化数值Ns。
  评论的客观性通过标题及评论中的产品属性特征词数目进行量化,对标题及评论内容进行分词、词频统计、词性标注、去除停用词等处理,得到初始词语集合,由于产品属性词常用名词表达,所以抽取前10%的名词和名词性短语作为产品属性词典。将处理得到的每条评论中的词语逐词与产品属性特征词典进行匹配,统计匹配成功的词语个数,作为产品属性特征词的量化数值No。
  在线评论有用性排序结果如图3所示,从评分指标来看,各产品排序靠前的在线评论,其平均评分普遍低于排序靠后的平均评分。排序靠前的评论在时效性、有用性投票、情感词数、客观词数的指标均具有一定优势。可能由于对产品不满意的消费者更容易发布较为详细的评论,以通过对商家的“报复性”行为来试图缓解自己的焦虑情绪,同时对其他潜在消费者起到警示作用。从评论长度指标来看,评论长短不是决定因素,而是有效长度的影响。
  小家电、电子产品平均价格较高,图书和影视音像价格最低。图书、电子产品以及母婴用品是评论最多的品类,图书平均每个产品1 004条,影视音像平均评论最少。图书、个护健康、小家电的好评率最高,图书好评率高达86.37%,影视音像、汽车用品的好评率最低,影视音像好评率仅有69.39%,过滤后各种类的好评率均有下降,变化最多的是办公用品和小家电,变化最小的是图书和电子产品。电子产品、母婴用品差评率最高,电子产品差评率高达10.65%,办公用品、图书差评率最低,办公用品差评率仅有6.24%,过滤后差评率均有提高,变化最多的是小家电、母婴用品,变化最少的是电子产品、汽车用品。
  依据在线评论有用性对评论进行排序、过滤后,好评率均有下降,差评率均存在提高现象。通过对评分为4分、5分的评论与评分为1分、2分的评论,在评论有用性影响指标角度进行独立样本T检验,结果如表4所示。好评和差评的各指标存在显著差异,差评的平均时效性、有效长度、有用性投票、情感词数以及客观词数相比好评来说具有明显优势,尤其是有用性投票和产品属性客观词的数目。
  4在线评论与销量的关系
  为进一步研究在线评论与销量的关系,同时考虑到可能存在的共线性问题。本文采取逐步多元回归的方法,以图书、办公用品、电子产品为例,如表5所示。
  模型2相比模型1的R2值增大,说明在进行评论有用性排序过滤后,模型的整体拟合效果略有改进,方差膨胀因子VIF均在1左右,各变量之间不存在明显的共线性问题,且Sig.值均小于0.01,所得结果具有较高的可信性。
  评论总数显著影响产品销售量,评论数量越多,知晓效应和从众心理对消费者的影响越明显,促进产品销售。评论的平均天数能够反映产品的上市周期,随着销售时间的延长,产品更新换代及消费者关注度下降等因素使产品销量下滑现象显著。关于评论数量与时效性对产品销量影响的多数相关研究结论一致[47],但情感极性的研究结果各不相同,部分学者认为情感倾向对搜索产品和体验产品的销量均具有显著影响[48],但李玉玉等人对搜索型产品进行研究证实其不具有显著影响[49]。本文研究发现情感倾向对电子产品等搜索型商品的销量影响并不显著,评论评分的劝说作用相比产品自身特征来说效果不明显。对于体验型产品来说,情感倾向对产品销量的影响应更为明显,且办公用品的好评率在评论过滤后变化明显,有用性高的评论对消费者决策的影响更大。但图书的消费者评分普遍较高,且分布集中,因此情感倾向对图书销量不具有显著影响,张心悦等人也得出同样结论[29]。   产品价格对销售量不具有显著影响。由于图书、办公用品等价格较低,且相差不大,消费者对价格不敏感。而电子产品等搜索型产品,消费者更多地根据自己的偏好和产品质量来选择,同样对产品价格不敏感。王文君等人通过对手机在线评论与销量的关系研究也发现价格不是显著影响因素[50]。由于多数评论字数相差不大,用于衡量评论信息丰富性的评论长度对销量影响并不显著。
  5总结
  通过分析在线评论的6个指标,构建评论特征矩阵,采用模糊层次分析法对其赋权,并基于灰色关联分析法构建用于过滤用户评论的有用性排序模型。以亚马逊的8个种类的产品在线评论为例,对其进行有用性排序,从结果来看,排序靠前的在线评论,评论在时效性、有用性投票、情感词数、客观词数的指标均具有一定优势,但平均评分普遍低于排序靠后的平均评分。差评的平均时效性、有效长度、有用性投票、情感词数以及客观词数相比好评来说具有明显优势,尤其是有用性投票和产品属性客观词的数目。因此,依据在线评论有用性对评论进行排序、过滤后,好评率均有下降,差评率均存在提高现象。依据有用性对在线评论进行排序、过滤,探究在线评论对产品销量的影响。评论总数、评论时效性显著促进产品销售。情感倾向对搜索型商品的销量的影响并不显著,对于体验型产品来说,情感倾向对产品销量的影响应更为明显。但产品价格及评论长度对销售量不具有显著影响。
  基于有用性排序的在线评论与产品销量的关系研究,是在线评论的重要研究方向,在线评论的有用性排序有利于消费者有效筛选更有价值的评论信息来做出购买决策,而经过滤后的在线评论与产品销量的关系研究也能为电子商务经营者提供巨大的商业参考价值。
  参考文献
  [1]姜剑,张睿,于陶静.电子商务背景下在线评论研究[J].中国市场,2015,(41):69-70.
  [2]BrightLocal.Local Consumer Review Survey[EB/OL].https://www.brightlocal.com/learn/local-consumer-review-survey/.
  [3]于丽萍,夏志杰,王冰冰.在线评论对消费者网络购买意愿影响的研究[J].现代情报,2014,34(11):34-38.
  [4]Ren J,Yeoh W,Ee M S,et al.Online Consumer Reviews and Sales:Examining the Chicken-Egg Relationships[J].Journal of the Association for Information Science
其他文献
当杜菲开口说话时,所有人的注意力都会聚焦在她的身上。温柔中蕴涵力量,娴雅中自带从容,淡然中彰显智慧,她的存在宛若磁石般形成极具吸引力的能量场,让人感到信任与安心。  这位山西太原土生土长的才女,曾经负笈留洋,在美国普林斯顿大学、哥伦比亚大学打磨青涩年华;也曾赴港深造,在香港大学攀上学问见识的又一高峰。  打开世界之窗饱览风云变幻、沉浸于知识殿堂博采百家之长、看遍了大千世界的宝马雕车玉壶光转之后,杜
〔摘要〕实现领域内信息系统互操作是大数据发展和应用的基础工作。面向大数据应用,依据IEEE关于互操作的定义,从能力角度出发构建理论框架,并从多个渠道收集资料比较分析中美健康信息系统互操作的方案和实践。相比美国而言,我国推进健康信息系统互操作的方案和实践在数据交换能力方面表现出明显优势,但是在数据使用能力方面则相对不足。为确保我国健康大数据发展和应用取得应有成效,应通过提升数据应用能力丰富数据来源,
形势无法改变,选择在于自己。  随着我国经济社会发展,留学的浪潮日趋热烈。近年来,另一个随之而来的现象亦引起关注:留学生“回流”的趋势越来越明显。随着“留学生”数量增多,“海归”的队伍越来越庞大,海归求职的难度也越来越大。尤其在特殊的2020年,“最难就业季”几乎困扰着每一位回国留学生。  留学生“回流”给求职带来哪些影响?海归如何适应变化找到出路?本文结合2020年海归就业数据,尝试为读者做出解
摘 要:[目的/意义]智慧社区是社区信息化进程中演化出的新形态和新概念,其相关研究对我国基层社会治理有重要的实践价值和理论意义。[方法/过程]因此,本文采用文献计量法和内容分析法,对WOS核心合集数据库中智慧社区相关的国际研究成果进行分析。[结果/结论]本研究从概念内涵和研究范式明晰了社区信息化发展研究脉络,并进一步总结了智慧社区研究的动力机制、议题关切和热点趋势,以期为我国智慧社区建设和可持续的
摘 要:[目的/意义]以基本心理需要为中介变量,探索用户人格特质对虚拟社区信息分享行为的影响,对于促进虚拟社区健康可持续发展具有重要意义。[方法/过程]基于大五人格理论和自我决定理论,构建理论研究模型,并借助AMOS软件开展路径分析与中介效应分析,研究分析了人格特质对虚拟社区信息分享行为的影响,以及自主需要、能力需要和关系需要的中介作用。[结果/结论]研究结果表明:外向性、尽责性人格能显著正向影响
〔摘要〕数字资源事实数据的计量是图书馆统计工作的重要组成部分。本文根据笔者多年从事馆藏数字资源计实践经验,提出了数字资源计量中存在标准不连续、含义指代不明及使用统计不规范等主要问题,分享了西北农林科技大学图书馆在具体操作中的解决办法,即人工统计、导航汇总与等同下载。在此基础上,笔者建议图工委、DRAA与各馆首先各司其职,共同致力于数字资源计量的可持续、可比较服务;其次指出国内数据库商需要根据国际计
2021年1月19日,美国大学理事会正式发布通告,宣布取消SAT科目考试和SAT写作考试。不过,2021年6月的SAT科目考试和SAT写作考试仍将进行,考生可自行选择退出考试或者继续考试。  SAT科目考试  据称,SAT科目考试在国际上被广泛应用,而随着美国大学预修课程(AP)的推广,学生将不再需要科目考试来证明自己。因此美国大学理事会将不会在美国提供SAT科目考试,国际生在2021年5月和6月
〔摘 要〕SDOS数据库是深受高校广大科研用户欢迎的电子产品,有关它利用情况的研究为数不多。针对这一状况,本文以西北农林科技大学为例,筛选出该数据库中的151种高效期刊,并重点分析了这些期刊的学科分布、利用率及利用水平,指出图书馆应当采取积极措施,抽调专门人员对数据库的利用情况进行摸底调查,重点发挥高效期刊对于外文文献资源建设以及科学使用文献购置经费的指导作用,并加大宣传力度以进一步提高其利用效果
〔摘 要〕就高校校 区间隐性知识IC路径共享而言,其运作框架包括相互制约的实体层虚拟层管理层和IC团 队四大部分,其绩效评估的逻辑框架有“一个目标,两大特点,三项原则,四类指标”四大 要件,进而依此设计出三层架构的指标体系  〔关键词〕IC;高校校区;隐性知 识;共享绩效;逻辑框架;指标体系  〔中图分类号〕G258.6 〔文献标识码〕A 〔文章编号 〕1008-0821(2009)08-0008
〔摘要〕数据素养已成为影响科研能力的重要因素。通过对上海地区高校教师的问卷调查,从数据态度、数据意识、数据知识、数据技能、对数据服务的需求5个方面,对高校文科和理工科教师数据素养的现状和需求进行对比与分析。目前高校教师的数据态度和数据意识整体上呈现积极乐观趋势,但数据知识和数据技能欠缺,亟待开展嵌入科研的数据服务;同时,文理科教师均对数据服务需求强烈,但同中有异,图书馆要按各自需求侧重不同的服务方