论文部分内容阅读
推荐系统作为有效的信息筛选工具,已被广泛应用于智能商业、辅助决策、预诊断、智慧城市等多个行业,其本质是基于收集的交互数据提取用户偏好,以实现精准的信息过滤。但随着参与用户及物品数量的急剧增长,单域的推荐性能明显受到了数据稀疏性和冷启动问题的影响。因此,能够缓解以上问题的跨域推荐技术成为了研究热点,基本思想是通过域间数据的相似性进行关联,以填补目标领域的缺失信息,进而改善推荐性能。然而由于跨域技术涉及的数据来源多样,类型不一,使得跨域推荐存在异构协同、隐私泄露和投毒攻击等诸多挑战,主要包括:(1)多源异构数据融合中数据的多元关联性导致隐私泄露机理复杂问题。数据关联的多元性不仅增强了攻击者的背景知识,也使得数据隐私的泄露机理更为复杂,使得跨域中的隐私问题更具挑战性。(2)跨域环境下的隐私保护机制与推荐算法耦合关系复杂。跨域环境下,分域管理的数据通常会经过匿名处理之后再执行推荐分析,因而隐私处理方法会直接降低输入数据的质量,进而影响推荐结果的精确度,二者之间存在复杂的耦合关系。(3)动态开放的应用环境下数据完整性与可信性等安全威胁更为复杂多变。跨域环境具有动态开放和去中心化特性,存在信任危机问题,目前缺少有效的数据控制与用户管理机制,难以抵御参与者的投毒攻击。以上挑战可以归纳为个性化推荐中数据跨域协同的安全可信与推荐精度的共赢问题,是本文的研究焦点。围绕跨域推荐中多源数据的高效协同、隐私信息的安全控制、跨域环境的可信管理等问题,本文的主要研究工作如下:1.面向跨域推荐提出一种能提供隐私保护和偏差修正的数据协同计算方法针对跨域数据融合中数据的关联性导致数据隐私泄露模式更为复杂的问题,提出一种具有偏差修正和差分隐私保护特征的深度学习协同推荐方法。具体来说,首先,该方法通过辅助领域信息的融合对目标领域的异常点进行偏差修正,以提高推荐的精确度;其次,针对数据的多元关联性使得数据融合过程中存在更为复杂的隐私泄露问题,采用差分隐私模型在协同训练过程中对用户评分数据添加噪音进行扰乱,以保证隐私数据的安全性;然后,针对目前没有相应的指标用于评价推荐算法在长尾效应方面的表现,提出一种新的评价指标-发现度,用以度量推荐算法发现用户隐性需求的能力。最后,通过理论分析和模拟实验结果证明,该方法能够在保证隐私安全的前提下,相比现有的方法推荐性能在F1和发现度指标上均提高了4%以上,多样性指标表现更为稳定。2.面向跨域推荐提出一种具有安全存储和可信追溯特征的数据协同计算方法针对跨域数据协同过程中隐私处理机制与推荐算法存在的复杂耦合关系,引入区块链技术提出一种安全精准的跨域协同推荐模型。具体来说,首先,该模型采用多链结构来实现交易数据与用户属性、项目信息的分离存储,实现在不修改数据的前提下保护隐私信息的安全。其次,该模型的推荐中心只收集没有用户或产品信息的关系链,实现数据的无损安全融合。因为推荐中心在未知用户属性和项目信息的情况下,无法将敏感的关系与具体的用户个体关联起来。因此,对推荐中心而言,数据的隐私信息是安全的。然后,为了保证跨域背景下数据的可信性,设计了一种基于签名的可验证机制来防止交易数据被篡改,以确保推荐分析是基于未修改的交易数据进行的,进而保证推荐模型的准确性;同时也设计了一种基于贡献的激励机制,降低了恶意节点的攻击概率。最后在真实的数据集上进行了实验验证,结果表明该模型能在保护数据安全可信的前提下,在精度和F1指标上提高约2%以上,同时保持发现度和多样性指标更为稳定。3.面向跨域推荐提出一种基于多特征知识图谱和区块链的数据可信协同计算方法针对以上方法只能应用于用户存在重叠场景的局限性,提出一种基于多特征协同知识图谱和区块链的可信跨域推荐模型,可以适用于不同的应用场景。首先,分析了隐私特征与推荐特征之间的差异,提出了适合异构数据安全表述的特征知识图谱,可以实现复杂关联知识的完整表示;其次,为了实现分布式环境下数据的安全融合,集成联邦学习框架实现具有隐私保护的分布式机器学习,同时结合区块链建立分布式共信机制,能够实现多元关联数据的安全无损融合和可信管理,保证跨域推荐的精准性。该模型能够适用于用户/项目存在重叠或不存在重叠的场景下,不需要隐私保护技术的泛化和集中服务器的协调就能保证数据的隐私安全与真实性验证,实现了推荐精准性、数据可信性和隐私性的多重保证。最后,通过理论分析和模拟实验结果证明,相比基线而言,该方法可以提供数据协同的安全可信性保证,并在F1指标上提升1.5%以上,多样性指标提高18%,具有明显的优越性。4.面向跨域推荐提出一种基于区块链的分布式数据安全控制和用户行为管理机制,实现去中心化的数据可信管理分析了跨域推荐场景下的数据融合具有动态开放、去中心化等特征,导致数据的完整性与可信性等安全威胁更为复杂多变,区块链技术虽然可以突破现有的数据安全管理机制中基于身份验证的局限性,但存在共识延时难以满足跨域推荐中高交易率的应用需求。针对该问题,提出了一种基于区块链的分布式数据安全控制和用户行为管理机制,以实现分布式环境下用户的行为管理和数据的有效验证。首先,采用区块链分片的思想,利用RAFT协议作为局部共识机制,提高了共识算法的效率,以满足跨域推荐应用中的高交易率需求;其次,提出了基于行为的激励机制,来弥补RAFT协议的容错性;同时设计了一种可监督的局部共识策略和带权重的重加入规则,能够抵御区块链中的搅动攻击,保证分区的安全性,提高系统的容错能力。最后,通过理论分析和模拟实验验证,该协议能够有效提高共识算法的效率,同时保证去中心化数据融合的安全性,实现跨域推荐应用中数据的安全可信管理。5.面向产业应用需求设计了安全可信的跨域数据协同计算与智能推荐方案本文的研究工作围绕跨域推荐中隐私数据的安全性、匿名数据的可验证性和推荐结果的精准性之间存在的冲突问题,面向不同场景提出了一系列的解决方案,结合相关产业的应用需求,将多源数据协同计算的关键技术用于系统设计中,并在农牧业领域中设计了具体的应用平台,验证了相关技术的可行性、有效性和实用性。这些工作能够为跨域推荐场景下的数据协同计算提供安全可信的解决方案,推动安全领域中可信验证技术的理论研究和推荐系统在分布式跨域环境中的应用发展。