论文部分内容阅读
推荐系统作为一种重要的信息过滤技术,它的安全性也受到广泛的关注。研究指出托攻击的存在严重威胁着推荐系统的安全性。托攻击通过对系统注入带有偏见的恶意概貌能改变推荐系统对于物品的评判,从而谋取不正当的收益。若不妥善应对,推荐系统运营者与用户的利益都将遭受侵害。托攻击的研究主要分为攻击模型和攻击检测两部分。前者的工作主要从要求知识、攻击目的、攻击目标、攻击规模等方面定义了攻击的基本框架以及具体的攻击模型;后者则从用户概貌或者评分序列两个角度入手,找出托攻击的特征并加以区分。本文在以下两个方面开展了研究,针对当前算法的不足,提出了有效的解决方案:①本文提出了基于狄利克雷假设检验的评分序列异常检测(DHT)。该方法使用狄利克雷分布来描述子序列分布的变化情况,然后以此来做出统计推断,判定子序列是否为异常序列。本文的方法较以往方法能更准确地捕获分布的变化情况,并设计使用狄利克雷假设检。该检验方式具有相比一维高斯假设检验或非参的卡方检验具有更强的针对性,以及更小的错误率。实验结果也验证了本文较对比算法具有更高的召回率与准确性。②本文总结了基于用户概貌的检测技术与评分序列的检测技术的各自具有的优势与劣势,找出了两种检测技术的漏洞。评分序列的检测可以利用知识注入服从该序列分布的攻击来避过检测系统。更为严重的是忽略了攻击概貌的毒性(单个概貌对其目标项评分地影响),在毒性很强的情况下,即便少量的(1%-3%)攻击都可能对目标评分产生巨大的影响。基于用户概貌的检测技术的漏洞在于当攻击者具有足够的知识,模拟出于用户概貌几乎无差别的攻击时,用户概貌的检测技术几乎没有任何效果。为了弥补这些缺陷,本文提出了一种混合检验的技术使两种手段能够相互弥补自己的缺陷。混合检验以减少攻击所带来的影响为目标,从两个方面来遏制托攻击的影响:降低攻击发生的速率与降低每条攻击可能带来的影响。实验在几种典型的推荐系统中进行了实验,验证了以下两点:1)模拟攻击能够绕过基于用户概貌的检测技术,而高毒性攻击能够在序列检测未起作用的情况下对推荐系统造成巨大的影响。2)混合检验能够结合两种检测技术的优势,弥补各自的缺陷。从而极大地限制托攻击对推荐系统带来的影响。