论文部分内容阅读
21世纪我们乘坐在互联网技术这辆高速列车上,在享受互联网带来的巨大便捷和红利的同时,互联网产生的大规模数据引发了信息超载问题。通过搜索引擎,我们可以检索相关的内容,但是无法满足我们个性化的数据需求;个性化推荐系统广泛进入我们的视野,成为解决信息超载问题的有力工具。然而单机版的个性化推荐系统在面对海量的数据时,仍然不能提供高效快捷的个性化服务,因此需要把能够高效处理大规模数据的Hadoop平台和个性化推荐系统相结合才能在海量数据环境下提供令人满意的个性化推荐服务。通过调查分析,大量的就业招聘信息是通过第三方就业信息服务网站来发布或被收录其中的;应届毕业的大学生因为求职渠道相对狭窄,对个人的职业追求不是很明确,在就业难的大环境下,再加之大量的就业信息围绕在身边,更是不知所措,找一份合适的符合个人实际情况的工作显得很困难。基于上述问题,构建一个基于Hadoop平台的大学生个性化就业推荐系统显得十分有必要。在前人的研究基础上,结合就业信息推荐的实际,本文完成了以下工作:1)从实际需求出发,设计了一个能够处理大规模数据的个性化就业信息推荐系统,包括个性化推荐引擎,用户相关模块和分布式系统模块三部分。将在线推荐和离线数据分析与计算相结合,高效快捷地为大学生提供符合其个人实际情况的就业信息。2)考虑MapReduce和Mahout的特点以及对个性化推荐理论的研究,再结合实际应用环境,对基于内容的推荐进行了改进。使其不再依赖于历史数据,从而能够克服推荐系统冷启动问题。再将改进后的基于内容的推荐和基于物品的协同过滤推荐组合成并行式混合推荐,又可以克服推荐系统的稀疏性问题。3)通过仿真实验和系统测试,证实本系统能够解决就业信息超载问题,可以把“人找工作”的模式转变为“工作匹配人”的模式,为大学生提供个性化的就业信息推荐服务。