基于主题情感联合概率模型的虚假评论检测研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:dfsdfdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能终端设备的普及,消费者倾向于通过网上购买商品,这催生了电子商务的繁荣。由于电子商务虚拟环境普遍存在着信息不对称性,消费者无法准确获得商品质量信息,因此更多地借助历史评论衡量商品的好坏。然而,有些不法商家抓住机制的漏洞,雇佣网络水军撰写不实的言论以提高自身声誉,吸引消费者购买。评论大数据的产生使得人们很难用肉眼辨别出哪些是虚假评论。传统的虚假评论检测模型取得了一定的研究成果。但是,由于这些模型仅使用语言特征和语法结构特征,不能很好地挖掘文本的语义和情感信息,准确率的提升受到限制。深度神经网络模型虽然能够学习到文本的抽象特征,但是结果缺乏可解释性。为了提高虚假评论检测的准确性,本文以语义和情感为视角,提出无监督的主题情感联合概率模型UTSJ(Unsupervised Topic-sentiment Joint Probabilistic Model)。论文主要完成了以下几个方面的工作:(1)结合主题模型方法进行虚假评论检测。从语义和情感的角度,选取传统的主题模型LDA和融合情感的主题模型JST,研究该模型在虚假评论检测领域应用的效果。在传统LDA模型的基础上,增加情感层,提出无监督的主题情感联合概率模型UTSJ。(2)在真实的Yelp评论的语料集上进行了大量的对比实验。首先,复原传统的虚假评论检测模型。在传统模型中选取基于文本语言特征模型(n-gram模型,character n-grams模型)和基于浅层语法特征的模型(POS模型)作为基准模型。其次,分别对两种领域数据(酒店和餐饮)构造均衡数据集和不均衡数据集,研究复原算法与本文提出的算法对虚假评论检测的性能。实验结果表明本文提出的算法在均衡数据和不均衡数据情况下的虚假评论检测的准确率都高于对比算法,且本文算法更适合真实电子商务环境下的不均衡大样本情况。
其他文献
随着我国商业银行在数量上不断增长、竞争不断加剧,“以市场为导向、以客户为中心”的经营理念开始为各家商业银行所普遍接受并实行。这表明外部服务的重要性已经被越来越多的专家学者以及企业管理者们所认知,然而实践表明,上述人群对于内部服务的重视程度尚不足够。抛开模式化的产品制作与柜面服务不谈,商业银行给予外部顾客的定制化、差异化服务主要来自“客户经理”这一群体,因为这一群体是联系商业银行与外部客户的重要桥梁
命名实体识别(Named entity recognition,NER)任务旨在从非结构化的文本数据中定位并分类出预定义的实体类型(如人名、地名和组织机构名称等)。命名实体识别是自然语言处理中
拟南芥过敏性诱导反应蛋白(hypersensitive induced reaction proteins,AtHIRs)是植物中特有的具有SPFH(stomatin/prohibitin/flotillin/Hflk/C)结构域的蛋白,与膜筏的形成密切相关并在植物免疫过程中发挥重要功能。本研究通过激光扫描共聚焦显微镜(laser scanning confocal microscope,LSCM
激光等离子体从产生到膨胀冷却的过程中存在着复杂的电离和复合等原子过程。这些原子过程之间的相互作用决定了等离子体的状态,使得等离子体具有复杂的光谱结构和较大的电子
总体差异比较是市场调查、经济、医学和教育领域经常遇到的问题,总体比较属于假设检验问题里的一个内容.当总体分布类型为已知分布时,我们使用传统的参数假设检验方法;而当总体分布类型不知时,传统方法不再适用.本文的研究主要是建立一种半参数方法用于研究两总体分位数之间的差异。半参数方法已经成为当代统计领域的研究热点之一.近些年,在半参数密度函数模型下建立了许多关于半参数统计分析的研究成果,其检验结果往往优于
2007年5月,国务院学位办下达相关文件,批准24所高校开展汉语国际教育硕士专业学位的教育试点工作,2009年6月,又新增39所院校。论文写作是学生读研的最后一步,也是最难的一步,
保护耕地是实现粮食安全的必要条件。为此,我国出台了一系列耕地保护政策,但总体而言耕地保护政策实施效果欠佳。除缺乏健全的监管机制外,更重要的是现行耕地保护机制对耕地
在高端制造领域,数控机床的战略价值不言而喻,航空航天、高端汽车、大型旋转机械和精密加工等重要领域都无法离开数控机床。角度头是安装在数控机床上的一种加工附件,可以在
随着制造业向智能化方向的发展,工业机器人在工业生产中得到日益广泛的应用,但是工业机器人领域的人才缺口巨大,重要原因之一是缺乏有效的教学体系。工业机器人领域的人才培养离不开实验教学,虽然众多高校和职业学校都开设了工业机器人实验课程,但是由于教学条件的限制,存在实验效率低下、教学效果不佳的问题。为提升实验教学的效率效果,响应“新工科”实践的号召,本文设计了网络化工业机器人认知与操作虚拟仿真实验平台,主
信息时代人们对信息获取的需求日益增加,尤其从图像中获取有用信息的需求在各个邻域都变得非常重要。图像中目标的边缘信息获取是图像信息获取的重要研究方向之一,也是图像分析的基础。本文围绕灰度图像中目标的边缘检测展开了研究,对已有的边缘检测算法进行了改进,主要工作如下:一、提出了改进的多方向结构元素边缘检测算法。在介绍形态学边缘检测算子的基础上,分析了多方向结构元素对边缘检测结果的影响,对传统的多方向结构