基于用户兴趣的文章推荐系统的研究与实现

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:daniel86999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着网络的普及,互联网中文章的数量增长速度惊人,现如今我们已经进入到了信息爆炸的时代。面对海量的数据信息,用户难以从其中筛选出自己感兴趣的内容进行阅读。因此,降低访问和分发文章的难度,提高文章阅读效率以及提供用户友好型阅读平台,已成为当前需要解决的最重要问题。文章推荐是通过提示用户阅读他们感兴趣的文章来解决此问题的重要方法。协作过滤算法由于其简单性和实用性被广泛用于推荐系统中。但是,该算法仅将用户行为作为感兴趣的凭据,而忽略了文章文本的内容,因此推荐的准确性较低。另外,协同过滤算法需要通过所有用户的查找发现用户的相似邻居,在推荐系统用户增多的情况下,算法的效率就会大打折扣。因此,本文基于用户的协作过滤算法,通过将隐狄利克雷主题模型(LDA)模型和Word2vec结合起来识别用户感兴趣的主题,对用户进行分组,提出了基于用户兴趣的文章推荐方法。首先,LDA定义了从单词到主题,从主题到文档的全局层次关系。Word2vec是一种从目标词周围上下文中预测目标词的词嵌入模型。本文将LDA模型与Word2vec模型相结合,利用距离包从文档中提取语义空间特征。距离包不仅建立了文档与主题分布的关系,而且整合了词的上下文关系,使得基于主题特征的文档分类更有意义。与此同时,本文采用主题模型和词向量模型结合的方式对用户的文章内容进行分析,以文章和主题的距离分布的形式描述用户的兴趣。其次,为了降低相似度计算的搜索开销,提高文章推荐效率,本文采用了优化后的K-means算法对用户进行聚类操作后,再对相似用户进行聚类搜索。最后,完成了文章推荐系统的设计与实现,通过实验验证了本系统在推荐文章的准确性方面有一定的提升。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
学位