论文部分内容阅读
近年来,随着信息技术的广泛应用和迅猛发展,各式各样的移动终端、互连设备逐渐走向了网络化、智能化,深刻的改变了人们的日常生活习惯。人们不再是被动地从网络环境中获取信息,而是积极地参与到社会网络信息的创造和分享中。大范围多领域的广泛参与使数据信息在短时间内迅速增加,呈现出爆炸式增长的趋势。数据规模的迅速增长既给人们带来了前所未有的机遇,也给海量信息的检索带来了挑战。普通用户已经很难通过在短时间内对页面进行主动浏览来获取大量有用的数据信息。虽然传统的“目录”式信息检索方式和“搜索引擎”式信息检索方式在一定程度上缓解了信息超载带来的信息选择难问题,但这些传统信息检索方式也存在着一些明显的不足,如检索结果的大众化,不能准确识别用户的真实意图等。粗放式非个性化的信息过滤方法已经不能满足人们的需求。人们迫切需要这样的技术,它能够根据用户的历史交互信息来推断用户的兴趣偏好,并根据用户目前所处的状态为用户精准的产生个性化的检索结果。推荐系统就是在这种背景下产生和发展起来的。与此同时,随着社会网络应用的普及,人们也越来越愿意将自己的个人信息和生活轨迹分享在各种网络平台上,这也为实现智能的信息检索系统奠定了基础。 推荐系统通过分析用户的历史数据信息为用户建立适当的兴趣偏好模型,并基于兴趣偏好模型进行预测和推荐。在所有类型的推荐系统中,基于用户评分行为的推荐系统是其中应用最为广泛、数据模型最为简洁的一种,在实际商业应用中有着举足轻重的意义。基于用户评分行为的推荐方法研究主要对用户已知的历史评分数据进行分析,然后实现对未知评分的预测和推荐。然而,目前基于用户评分行为的推荐算法仍然存在着一些不足和挑战:(1)推荐算法准确率有待提高且数据集的稀疏性对推荐算法的准确率影响较大;(2)推荐算法的抗攻击性不足,无法有效阻止社会网络中虚假用户评分的干扰;(3)推荐算法通常具有较高的时间复杂度。针对以上三个问题,本文进行了深入的研究,并提出了一种新的基于用户评分行为的推荐方法,该方法建立在用户表象特征分布和因子分析技术的基础上,并将社会网络中用户的信任模型引入到推荐算法的设计中,从而提高推荐算法在评分预测方面的准确率和抗攻击性,降低推荐方法对稀疏数据集的敏感性。与此同时,为了有力的支撑不同推荐算法之间的对比实验和改善推荐算法时间复杂度高的问题,一个开放式的基于Hadoo p和 Tas te的推荐算法实验平台被开发。该平台通过集成多种类型的推荐算法和数据集实现不同推荐算法的“一键对比测试”,并通过Map Red uce并行计算模型提高推荐算法的执行效率。