电子商务网站的虚假商品评论检测系统

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:gin901122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,虚假的商品评论在电子商务网站中不断地涌现,这些虚假评论严重影响了电子商务网站的公平和公正。由于虚假评论隐藏在大量的真实评论之中,现存的研究方法仅仅将虚假评论作为一个孤立的静态问题来研究,很难快速有效的发现虚假评论。针对以上问题,本系统通过对用户的评论行为进行分析,挖掘虚假评论及其添加者之间的关系,锁定发布虚假评论的嫌疑用户及其评论,并基于相应的语义分析模型对评论文本进行情感分析,为确定嫌疑用户的评论是虚假评论提供数据支撑。为了能够准确地发现虚假评论,本文做了如下几方面工作:1、研究电子商务网站虚假评论的来源和规律,研究当前解决虚假评论问题的常用方法和技术手段,以及这些方法和技术的使用场景、优缺点等。确定本系统的需求和研究目标,在详细调查和研究的基础上设计出数据处理子系统、嫌疑用户探测子系统和嫌疑用户管理子系统来实现系统的目标。2、针对数据量大,数据离散和部分数据不完整等问题,建立数据处理子系统,处理商品评论数据、用户信息数据和用户交易数据。数据处理子系统主要用于整合来自各个外部系统的数据,通过并行触发多个Spark Job来完成商品评论数据的处理,用户信息数据的收集和用户交易数据的统计。3、针对商品评论真假难辨、虚假评论添加者的反侦察能力不断增强的现状,本文通过对用户添加虚假评论的动机进行分析,建立动机和评论之间的关联,创新地使用混合评论覆盖率算法、行为时差法和编辑距离等算法挖掘出具有可疑行为的用户;并使用基于细粒度的商品评论情感分析法对用户的评论进行语义分析,挖掘出语义所蕴含的情感;建立评估模型,将用户的行为数据和评论的语义分析结果应用到模型中,对嫌疑用户进行综合评估。4、针对虚假评论的证据分散和不集中的问题,开发嫌疑用户管理子系统,将嫌疑用户的基本信息、交易信息、评估结果和证据集中展示,以方便业务运行维护人员核定嫌疑用户及其虚假评论,并最终将嫌疑用户的评论确定为虚假评论。嫌疑用户管理子系统使用Spring和滚动侦测技术从多维度来呈现相关数据,使业务运行维护人员能够高效地找到确定虚假评论及其添加者所需的证据。虚假评论检测系统的测试和实际运行结果表明,本系统能够准确、高效的将需要的数据收集起来,具备发现嫌疑用户的能力,业务运行维护人员能够通过本系统确定嫌疑人及其虚假评论。使用本系统,极大的净化了电子商务网站的交易环境,提高了交易过程的公平和公正。
其他文献
2011年7月12日至15日,由沈阳师范大学承办的中国教育技术协会期刊专业委员会2011年年会在沈阳顺利召开,来自19家期刊的27位代表出席了本次活动,沈阳师范大学副校长李铁君出席会
健康教育作为整体护理工作中重要的环节之一,在临床开展过程中,面临着需要提高其层次和水平的问题.现就护士因素对健康教育的影响进行分析,推动其向纵深发展.
[摘要] 中部地区在我国具有重要的战略地理位置。发展中部经济已提升到国家的宏观政策上来。新税法实施后,“两税合一”对中部地区引进外资会产生一定的影响,甚至可能还会给中部地区带来良好的机遇。  [关键词] 新税制 中部地区 作用 影响    我国内、外资企业所得税税法“两税并存”的局面从改革开放之初至今已有20多年。随着中国加入WTO及经济的市场化与国际化程度不断提高,自2003年起,“两税合一”呼
提出一种新型的LP-DMRC天然气液化循环,并利用软件对其进行了流程模拟。结果表明它具有流程简单、循环效率高等优点,不仅适用于大型液化工厂,也可用于小型天然气液化装置,具有良
1987年5月~2000年1月,我科收治胸壁结核术后复发病例17例,本文对其复发原因进行分析并提出避免复发的体会.
中国证券报报道:中国连续天量进口铁矿石,这其中到底有没有贸易商“固矿”、“炒矿”,一直引发市场众多争议。中钢协相关负责人士向中国证券报记者透露,最近一段时间,协会与国家相
为加快农村金融的发展,解决农民贷款难问题,近日,财政部和国税总局联合下发了《关于农村金融有关税收政策的通知》。今后,金融机构对农户发放小额贷款的利息收入,都将免征营业税。
选取了13个常用定量的期刊评价指标,并增加了一个“历史影响因子”。利用主成分分析将指标进行系统分类再基于期刊评价指标建立结构方程模型来探讨这些指标之间存在的结构关
作为战争类型片,电影《血战钢锯岭》在以史诗英雄为主角的战争叙事中,呈现出传统类型叙事的魅力。而隐藏在英雄人物成长主线背后的"爱情叙事段落",因其叙事篇幅很少被提及,但