论文部分内容阅读
大数据时代,以推荐算法为代表的信息过滤技术有效缓解了人们面对“信息过载”的焦虑。与此同时,尚未成熟的推荐算法与人们不全面的信息需求,也催生了“信息茧房”现象,带来网络群体极端化、人们对世界的认知失衡以及社会分化等恶劣的影响。如何削弱与避免“信息茧房”现象是我们必须要正视的问题。本文聚焦于从改进推荐算法角度,缓解与削弱“信息茧房”现象。本文结合“信息茧房”的特征与推荐算法的优缺点,提出从推荐算法方面缓解与削弱“信息茧房”现象的思路。第一方面,解决用户兴趣漂移问题,挖掘用户的潜在兴趣;第二方面,注重推荐结果的结构性;第三方面,注重算法的透明化、可解释性。针对于用户“兴趣漂移”现象,本文以基于内容的推荐算法为基础,提出基于内容的两阶段推荐算法(CBTS),建立动态推荐模型。算法第一阶段利用长短期兴趣与时间衰减刻画每一时刻的用户-标签权重,并构建过滤组件刻画过去时间段上每个时刻用户-标签权重与项目的对应关系;第二阶段利用预测组件基于过去时刻的用户-标签权重预测未来时刻的用户-标签权重。并针对“信息茧房”现象的特征与CBTS算法不足,就用户-标签结构性与推荐结果的结构性问题,分别使用熵值法思想与分批迭代方式对基于内容的两阶段推荐算法进行改进,提出基于信息茧房与内容的两阶段推荐算法(TS-ICC),用以缓解与削弱“信息茧房”现象。实证分析表明,相对于常见的推荐算法,CBTS算法与TS-ICC算法在保证推荐算法准确性的基础上,可以更好的应用于长尾数据。同时,TS-ICC算法在缓和推荐结果对个人知识的狭隘和信息结构的不平衡上有着积极作用,即在缓解“信息茧房”现象上优于其他常见算法。