可过滤虚假评论的在线推荐系统设计与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:gaoyunlonggao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术飞速发展,信息交换日益频繁带来了信息选取的困难,推荐系统应运而生。推荐系统依据用户的需求和兴趣等,将用户感兴趣的产品进行推送。具有个性化的推荐系统现已广泛应用于很多领域,尤其是电子商务领域。但是在实际应用中,推荐系统容易受到虚假评论的攻击,使得推荐系统的推荐效果和可信度急剧下降。因此,对于推荐系统来说,实现有效的虚假评论过滤和精准推荐至关重要。目前已有大量针对虚假评论和推荐系统的研究工作,但是在面对虚假评论攻击的时候如何实现精准推荐仍然存在挑战,存在的主要问题包括:1)虚假评论的识别与过滤依赖大量带标注的真假评论数据集作为基础,已有的虚假评论数据大多数依靠人力标注且数据较少,如何自动获取大量带类标的真假评论数据集是实现有效过滤虚假评论、精准推荐的基础;2)精心设计的虚假评论导致推荐系统性能急剧下降,已有的方法利用文本的统计信息作为特征输入虚假评论的文本检测器无法实现对虚假评论的有效检测,因此如何有效的过滤真实数据中的虚假评论至关重要;3)已有的推荐算法在处理稀疏推荐数据的时候存在推荐效果差的问题,数据稀疏性会直接影响推荐系统的推荐效果。针对以上问题,本文提出了虚假评论攻防策略,设计并实现了可过滤虚假评论的在线聚类推荐系统。针对虚假评论自动生成问题,提出了基于条件文本生成式对抗网络生成虚假评论数据,设计数据循环利用来优化置信度的双循环图虚假评论检测算法。针对推荐数据较稀疏的特点,设计一种基于新型网络表征技术和丰富信息网络的新型在线聚类推荐系统。具体研究内容包括以下几个部分:(1)为实现自动生成带类标的虚假评论数据集,本文提出了基于条件文本生成式对抗网络的文本生成算法生成虚假评论数据。条件文本生成式对抗网络算法能够生成带有特定情感标签的可变长文本,并采用自动化的单词级替换策略保证生成文本的质量和多样性。实验验证了自动生成虚假文本的有效性,对于仅依据文本信息进行虚假评论检测的检测器无法实现其有效监测。(2)针对存在虚假评论的推荐数据,本文提出了基于双循环图的虚假评论检测算法。为了获得更为可靠的用户置信度和商店置信度的初始值,提出数据循环利用的方法获得第一次循环结束时的用户置信度和商店置信度,对用户和商店置信度初始值进行优化以构建合理的图过滤器;设计一种参考用户对商店的个人影响力的加权图过滤器;通过对加权图过滤器的置信度初始值优化,进行图循环过滤模型的二次迭代。(3)针对推荐算法中数据稀疏导致的推荐效果差的问题,提出了基于node2vec技术和丰富信息网络的聚类推荐系统。利用网络表征学习方法和单边投影法相结合将向量的形式表示用户-商店网络,有效的将用户-商店网络中潜在的特征依据向量的形式表现出来;针对数据稀疏性和聚类算法的聚类效果差等问题,提出了基于动态紧邻点的谱聚类算法,能够自动确定聚类个数和较高的聚类效果。利用分阶段个性推荐实现每个用户的个性化推荐。
其他文献
为了评价我国安全社区分布均衡度,提出合理可行的安全社区数量分布规划方案,采用基尼系数方法,以人口密度和人均GDP作为评价因子,对中国大陆31个省份2015年前备案的安全社区
<正>瓦楞纸板是产品包装的主体材料,它具有生产工艺便捷、成本低廉、材料易于回收利用的优点,被广泛用于制作纸箱、纸盒、包装衬垫和其他形式的纸包装产品。瓦楞容器包装可对
罗尔斯在《正义论》中提出的"满足最少受惠者的最大利益"的差别原则,以独特的视角关注了社会中的弱势群体,成为其正义理论的一大特色。对于弱势群体的关照是现代民主政治的要
主流写作理论致力于构建一个幻想的整体性,将媒介当成创作的工具。“媒介即信息”发现了媒介的审美性,破除了感知活动中感知能力与外在对象的二元对立,赋予文学感知以新的形
在全球范围内,原发性肝癌的发病率在所有恶性肿瘤中占比为4.7%,排名第六;但其死亡率占比却高达8.2%,位列第四。在原发性肝癌中,85-90%的患者为肝细胞癌(hepatocellular carci
本文以近年来发生的一系列校园危机事件为切入点,介绍我国校园危机的现状。从校园危机现状入手分析校园危机的分类、产生原因、解决目标。进而提出运用美国著名企业危机管理
利用2012年到2016年近五年时间的中国所有A股上市公司共1678家企业进行面板数据分析,实证研究得出了企业高管与员工之间的薪酬差距对企业绩效的影响。实证结果表明,企业中高
随着国内外各类电视栏目风格的不断成熟,应运而生的各类型电视节目主持人层出不穷。进而,主持人的风格与素养对电视栏目风格的影响力也越来越大。笔者在本文中将着重阐述主持
目的系统评价分子靶向药物——伊马替尼、舒尼替尼、瑞戈非尼、尼洛替尼和帕唑帕尼对比安慰剂或最佳支持治疗治疗晚期或转移性胃肠道间质瘤(gastrointestinal stromal tumour
四合木(Ttraena mongolica)是蒺藜科(Zygophyllaceae)单种属的古地中海孑遗植物,中国狭域和特有分布种,典型的西鄂尔多斯特有单种属和特有群系,国家二级保护植物,在植物分类、植