推荐系统中基于用户评分行为的欺诈攻击检测方法研究

来源 :燕山大学 | 被引量 : 1次 | 上传用户:lxw19831201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤推荐系统作为缓解“信息过载”问题的有效手段,广泛应用于电子商务领域,在提升网站浏览量、商品转化率、顾客忠诚度等方面有非常重要的作用。但是,协同过滤推荐系统也有脆弱的一面,恶意用户在利益驱使下可以人为地向推荐系统注入大量虚假评分,达到影响或操纵推荐结果的目的。因此,如何检测出各类对协同过滤推荐系统造成威胁的欺诈攻击,保证推荐质量,保障推荐结果的可信性,是当前迫切需要解决的问题。本文基于用户的评分行为,从用户多源信息的特征提取、多视角集成检测、自动检测、基于用户关系图的检测等方面进行了深入研究。
  首先,针对单一信息源提取的检测特征不能全面刻画用户评分行为的问题,提出一种基于用户评分行为多源信息的特征提取方法。具体地,基于信息融合的思想,定义项目时间流行度,并采用小波变换方法过滤噪声和不稳定信号。从项目流行度和评分时间融合的角度提取4个用户特征;从用户评分的时延,利用修正的条件熵和“休眠-评分”模型,提取2个用户特征;从用户评分值和评分时间融合的角度提取2个用户特征;从不同流行项目集合的角度,提取10个用户特征。
  其次,针对检测特征的冗余问题和有监督检测中的不平衡分类问题,基于上述用户评分行为的多源信息特征,利用最优特征子集划分方法构建多个检测视角,提出基于多核学习的多视角集成检测算法,自动确定各个分类视角权重。同时,还提出多次划分视角以增加基分类器多样性的策略。
  再次,针对传统检测方法所需知识成本高、泛化能力不强的问题,提出基于堆栈边缘线性降噪编码器的欺诈攻击自动检测方法。具体地,在边缘降噪编码器中,根据常见攻击模型的评分分布,提出项目干扰噪声的计算方法;并提出基于稀疏系数加权的低维特征提取方法,设计用于自动特征提取的堆栈边缘线性降噪编码器结构。依据自动提取的鲁棒、低维的检测特征,提出基于AdaBoost的欺诈攻击检测方法。
  然后,针对传统无监督检测方法中所需部分先验知识无法获取和检测准确率不高的问题,提出一种基于用户关系图的无监督检测方法。根据用户共同评分项目的数量、填充率偏差度、评分倾向差异度等因素,提出用户关系图边权重的计算方法;并利用稀疏降噪自动编码器进行图特征提取,以重构用户关系图。在用户关系图中,提出基于社区发现算法和社区特征的欺诈攻击检测方法。
  最后,在Netflix和Amazon数据集中进行实验,评估本文提出的方法对模拟生成的欺诈攻击和实际欺诈攻击的检测效果,并与已有的相关检测方法进行对比,验证所提方法的有效性。
其他文献
[db:内容简介]
目的:通过研究以性别决定区Y蛋白5(SexdeterminingregionY-boxprotein5,SOX5)和GATA结合蛋白3(GATA-blndingprotein3)为核心节点的调控网络在卡波氏肉瘤(KaposisSarcoma,KS)细胞增殖凋亡过程中作用,揭示转录因子SOX5、GATA3影响KS发生发展的分子机制,从而为KS治疗提供可能的靶点和理论依据。  方法:采用免疫组化和实时
新一代能源体系的建设和社会能源需求的发展,要求综合能源系统(Integrated Energy Systems, IES)到达安全、可靠、高效、经济的水平。相较于单个能源系统分析,无论在系统运行态势评估还是薄弱节点辨识等方面,综合能源系统的分析都会面临更多的挑战。主要体现在两个方面:  (1)系统物理规模更大、模型维数更高。随着多能源的深度互联和各种新型设备的接入,综合能源系统分析面对是对一个复杂
随着用电需求日益升高,区域电网的相互联系加深,电力系统规模不断扩大;同时世界各国调整能源结构,具有波动性和随机性的新能源及设备的接入,使得电力系统特性更加复杂,在这样的背景下,外在破坏、人员失误等都可能导致大规模的停电事故发生,同时在电网恢复过程中还需考虑各类机组特性,因此有效利用新能源并基于恢复过程中的关键问题制定分区并行恢复预案,对研究大停电后电力系统缩短恢复时间、减少恢复失败影响范围及提升恢
电动汽车的应用和共享模式的提出为改善交通拥堵和缓解环境压力提供了有效途径。将换电模式应用于共享电动汽车,在保持其换电便捷性优势的同时可以解决电池统一性的问题,具有良好的发展前景。而政府的补贴政策和共享运营商的定价策略是影响共享电动汽车大规模应用的关键因素。研究其补贴和定价策略,基于换电需求预测对电池仓库进行能量管理,可以为共享电动汽车产业的发展提供理论支持,有利于控制运营成本、提高决策科学性。本文
BALB/c和C57BL/6小鼠是实验小鼠中常用而遗传背景差异较大的两个品系.在作者建立的用于新基因功能初筛研究的动物行为学检测平台实验中,BALB/c和C57BL/6小鼠有着不同的表现.为了探索这两品系在有关实验中的不同作用,作者选取了结合随机测序与生物信息学分析设计合成的神经系统表达的一些基因的反义核酸(antisense)中的2个,用Hamilton微量注射器将其分别定量注射到BALB/c和
[db:内容简介]
聚酯纤维作为一种合成高分子材料,以其强度高、弹性好等优良的性能被广泛应用于纺织领域。聚酯纤维的生产过程主要包括聚合、熔体输送、纺丝以及后加工四个部分。作为起始环节,聚合过程生成的聚酯直接影响着生成的纤维性能。其中,特性粘度是衡量聚酯质量的关键指标。因此,实现聚酯特性粘度的精准预测十分必要。由于聚合过程具有高度非线性、时变性、复杂性以及耦合性等特点,建立准确的机理模型十分困难。因此,本文利用数据驱动
学位
Withthefast development ofmobileinternet, the shipment ofmobiledeviceshasexceeded that of traditional PCs, among which the Android system takes the first place in installation. Increasing traditional
学位
期刊