论文部分内容阅读
随着Internet的迅猛发展,接入Internet的服务器数量和其提供的信息数量都呈现指数增长的态势。面对如此海量的信息,人们往往感到无所适从,出现了所谓的“信息超载”现象。个性化推荐技术被认为是当前解决“信息超载”问题最有效的工具之一,但现有的个性化推荐系统面临着海量数据带来的数据存储、数据处理和推荐速度等方面的挑战,现有系统在推荐精度、推荐多样性、推荐冷门产品能力等方面仍然需要进一步改进。
本文利用基于二部图的算法进行个性化推荐,提出了通过适当降低产品的度来提高算法推荐冷门产品能力的方法,并在分析海量数据对现有的个性化系统带来挑战的基础上,提出了把云计算平台与个性化推荐系统结合起来的解决方法,设计出了云计算平台下的个性化推荐流程。主要工作如下:
(1)以基于二部图的推荐算法为切入点,研究该算法在推荐精度、推荐多样性和推荐冷门产品方面的性能,并从两个角度对算法进行改进:一是通过引入指数参数的方式来降低产品的度从而提高推荐精度和推荐冷门产品的能力;二是采用周涛提出的去重复属性的办法来提高算法的推荐精度。在Movielens数据集上测试的实验结果表明,基于二部图的个性化推荐算法在推荐精度、推荐多样性和推荐冷门产品方面有良好的性能,且上述两种改进方法均能进一步有效提高该算法的推荐精度,并且降低产品的度的方法还能提高推荐冷门产品的能力。
(2)深入研究云计算核心技术以及Bigtable、GFS、MapReduce工作机制,配置Hadoop云计算环境。
(3)通过分析现有个性化推荐系统所面临海量数据带来的挑战,论述个性化推荐系统向云计算平台转移的必要性,并从资源交付方式、数据存储能力和数据处理能力这三个方面阐述个性化系统向云计算平台转移的可行性。
(4)进行云计算平台下的个性化推荐算法设计,并对云计算平台下的个性化推荐系统和现有的个性化推荐系统进行对比。通过单线程运行环境和云计算运行环境的实验耗时分析表明,云计算平台在推荐实时性方面大大优于单线程平台。