论文部分内容阅读
随着电子商务技术的不断发展,个性化推荐逐渐成为网络营销的一种策略和手段。然而,传统的个性化推荐系统只是基于孤立的Web站点上仅存的数据库进行数据挖掘进而进行个性化推荐,存在着数据量不足以及评价稀疏等问题。为了使得推荐结果更加合理、精确、有效,对于参与用户产生更好的预测,提供更丰富的服务建议,电子商务平台希望能够彼此合作共享他们之间的数据。但是如果在数据发布过程中不采取任何数据保护措施,将可能造成各参与数据共享的商家/用户的隐私信息的泄露。因此,在电子商务平台上各种个性化推荐系统的数据共享需求下,如何在保护数据隐私的条件下挖掘并获得有效的、可靠的管理分析与决策支持的信息是目前迫切需要解决的热点问题。本文首先基于电子商务平台中相关的数据源格式的多样化,提出了数据共享中数据预处理的体系架构,从而将不同形式的数据源格式进行规整化、统一化;然后采用目前业内公认且适用的隐私保护算法对数据源信息进行隐私保护,并将经保护的数据源存储于可共享的中央数据仓库中;最终沿用目前主流的经典的个性化推荐算法完成有效的、可靠的推荐服务。具体地,将文中的主要研究内容和实现目标归结为以下几个方面:在文中剖析了目前电子商务平台中普遍适用的个性化推荐系统的特点与发展,从中找出各种个性化推荐系统对数据共享的实际需求;同时,探讨了目前数据共享中隐私保护的理论与技术的发展与应用,从中寻求可引入到推荐系统的数据共享环境下实施的数据隐私保护机制与算法;诚然,鉴于目前存在的数据共享中其度量模型与度量标准的缺失与不足,探索了将目前仍处于研究阶段的博弈理论与技术应用于数据共享的可量化数学模型的可行性。在文中设计了满足电子商务平台中数据共享需求下实施有效的隐私保护机制的个性化推荐服务系统的解决方案;实现包括数据预处理过程、数据的共享存储过程和相关的数据隐私保护算法等主要功能部件的系统原型;最终,在文中基于经典的个性化推荐服务算法的通用评价体系,采用了通用的开源性用户案例数据集来测试并评价所完成的工作成果。