论文部分内容阅读
随着社交网络的快速发展,出现了像Facebook、Twitter和YouTube这样成功拥有海量用户的社交网站。社交网络作为一种共享知识、与朋友联系互动的媒介,在我们生活中起到越来越重要的作用。标签分类是社交网络中的一项重要应用,例如在社交网络中的用户具有兴趣标签和好友关系标签。此外,用户也可以给社交网络中的各种文本、图片、视频信息打标签。在传统标签分类中,网络数据由单个标签表示。但随着各种社交网络应用的丰富,网络数据的形式也越来越多样化,单个标签已无法满足社交网络数据复杂和多语义的特性。因此,社交网络环境下的多标签分类研究得到了越来越多的关注。基于此,本文将针对社交网络结构分析、社交网络环境下的多标签分类以及多标签在推荐系统中的应用三个方面进行研究。本文的主要工作如下:(1)介绍了社交网络环境下多标签分类的产生背景和研究意义,分析了社交网络结构分析、多标签分类以及推荐系统的研究现状和研究缺陷,并详述了相关领域的概念、分类、关键参数和经典算法。(2)提出一种基于链接寿命的社交网络结构分析方法。将链接寿命加入社交网络结构分析中,研究链接寿命对于社交网络结构中重要的基础参数(包括度,网络直径和平均聚类系数等)的影响。实验表明,加入链接寿命后,社交网络的演化结构和传统的研究有很大的不同,特别是,链接寿命的微小变化会导致网络直径的剧烈变化。(3)在上述社交网络结构的基础上,提出了两种半监督的多标签分类算法。在两种经典的关系型分类器的基础上,加入must-link约束和不确定性概率,研究must-link约束对于多标签分类的影响。实验表明,该方法在大规模社交网络上比经典关系型分类器具有更好的分类精度和效率,尤其当已知标签数量很少的时候。(4)在上述算法计算得出的社会标签的基础上,提出了一种多源评价聚合算法。首先基于评分者的社会标签计算他们的权威程度,然后将权威程度加入多源评价聚合过程中,来更加准确的评估实体的真实得分。实验表明,该方法能有效消除推荐系统中的严格推荐者和宽松推荐者带来的干扰噪音,并且无需任何关于严格和宽松推荐者比例的先验信息。