论文部分内容阅读
随着时尚相关的社交网络和在线购物的快速发展,智能的个性化时尚套装推荐系统得到越来越大的需求。不同于传统的物品问题,套装的推荐的对象是一组时尚单品的组合。由于时尚套装的组合空间的庞大,使得几乎没有相同的用户使用过同样的搭配。就这导致我们没法直接进行协同过滤。在另一方面,分解模型是推荐系统常用的一个技术,被广泛地用于恢复目标矩阵/张量中缺失值。通过学习每一类物品以及用户的向量表示,并基于分解模型来计算出目标张量中的值。目标张量中的值给出了每个用户对的所有套装组合的喜好程度的预测。基于这些预测值,给用户推荐前若干个得分最高的套装搭配。然而,直接地基于学到的分解模型对所有的元素进行计算是不可能,特别是当矩阵/张量变得庞大的时候。因此,我们从两个方面提出对推荐系统的效率问题进行研究。首先,我们提出了一个高性能算法,基于采样的方法,研究基于CANDECOMP/PARAFAC分解模型进行最大值的搜索和估计。因为推荐系统只关心张量中最大的若干个值,并且对这些值的绝对大小没有严格的要求。所以,我们可以通过直接对最大值进行搜索和估计,从而节省大量的计算。我们设计的算法通过使得每个值被采到的概率正比于这个值。此外,我们将算法进行扩展,使得采样的概率可以正比于值的6)次方,从而使得最大值更加容易被发现。我们对这个采样算法进行理论上的分析以及通过实验在真实数据上进行测试。除了提出高性能的搜索算法,我们通过哈希表示来使得推荐系统更有效率。我们设计了算法来学习用户和物品的二值化向量表示,同时自动地根据用户的喜好来为做出个性化的推荐。个性化套装推荐是一个相对比较新的研究课题。套装推荐的主体是多个物品的接一个集合。我们利用深度神经网络来处理这个问题。我们的方法包含两个部分,一个是用于特征提取的网络,另外一个是基于分解模型的匹配网络。从而对套装的得分进行建模。我们此外还会介绍两种二值化码,同时在一个大型的真实数据上去衡量我们的结果。我们设计了广泛的实验来说明算法的性能和效果。