社交网络环境下的多标签分类研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:Hatchet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的快速发展,出现了像Facebook、Twitter和YouTube这样成功拥有海量用户的社交网站。社交网络作为一种共享知识、与朋友联系互动的媒介,在我们生活中起到越来越重要的作用。标签分类是社交网络中的一项重要应用,例如在社交网络中的用户具有兴趣标签和好友关系标签。此外,用户也可以给社交网络中的各种文本、图片、视频信息打标签。在传统标签分类中,网络数据由单个标签表示。但随着各种社交网络应用的丰富,网络数据的形式也越来越多样化,单个标签已无法满足社交网络数据复杂和多语义的特性。因此,社交网络环境下的多标签分类研究得到了越来越多的关注。基于此,本文将针对社交网络结构分析、社交网络环境下的多标签分类以及多标签在推荐系统中的应用三个方面进行研究。本文的主要工作如下:(1)介绍了社交网络环境下多标签分类的产生背景和研究意义,分析了社交网络结构分析、多标签分类以及推荐系统的研究现状和研究缺陷,并详述了相关领域的概念、分类、关键参数和经典算法。(2)提出一种基于链接寿命的社交网络结构分析方法。将链接寿命加入社交网络结构分析中,研究链接寿命对于社交网络结构中重要的基础参数(包括度,网络直径和平均聚类系数等)的影响。实验表明,加入链接寿命后,社交网络的演化结构和传统的研究有很大的不同,特别是,链接寿命的微小变化会导致网络直径的剧烈变化。(3)在上述社交网络结构的基础上,提出了两种半监督的多标签分类算法。在两种经典的关系型分类器的基础上,加入must-link约束和不确定性概率,研究must-link约束对于多标签分类的影响。实验表明,该方法在大规模社交网络上比经典关系型分类器具有更好的分类精度和效率,尤其当已知标签数量很少的时候。(4)在上述算法计算得出的社会标签的基础上,提出了一种多源评价聚合算法。首先基于评分者的社会标签计算他们的权威程度,然后将权威程度加入多源评价聚合过程中,来更加准确的评估实体的真实得分。实验表明,该方法能有效消除推荐系统中的严格推荐者和宽松推荐者带来的干扰噪音,并且无需任何关于严格和宽松推荐者比例的先验信息。
其他文献
随着金融分析、网络监控、传感器数据监控等新型数据流应用的出现,催生了一种新的数据管理技术——数据流查询处理,数据流查询处理技术已经在数据流应用中获得了较大的发展。
目前,在计算机和信息系统中大部分采用口令作为身份认证方法。其中,文本口令是使用最为普遍的,但其在安全性和可记忆性等方面都有很多的不足。研究证明,图形口令由于其更高的
文本的情感倾向性分析在实践中应用广泛。对于评论性短文本而言,抽取评价词语及其所评价的对象,是判断情感倾向的关键。由于中文语言存在的缺少形态变化及关系修饰灵活等特点
随着人类基因组计划的开展与现代生物技术的发展,人类积累的大量生物信息数据为揭开生命奥秘提供了数据基础。模体是生命密码的一种表现形式,模体检测问题是计算生物学一个重
中国电信综合业务配置平台(Integrated Service Provisioning Platform, ISPP)为移动核心网络提供了业务支撑系统配置各种服务的统一入口和集中门户,从而屏蔽了运营商内部业
伴随着互联网技术的高速发展,网络设备与计算机已经深入到国家机关、企业和千家万户中,我们对计算机网络的依赖性日益增强。同时我们要看到,许多计算机用户甚至网络管理人员
主动数据库系统是以传统数据库为基础并通过主动规则实现其主动性,事件监测是数据库主动性实现的关键环节。然而,传统事件监测方法存在的不完善:事件的语义表达能力差、不同种
随着信息技术的发展,越来越多的领域开始使用“图”来表示和存储数据对象之间的关系。这种类型的数据被称作“图数据”。近年来,在现实应用中积累了大量的图数据,其中蕴含了大量
目前,地理信息系统(GIS)已经被广泛应用于与人们工作和生活息息相关的各个领域。然而,不断产生的海量异构空间数据成为GIS各种应用的一个主要障碍。此外,数字地图的版权保护
嵌入式系统是以应用为中心,以计算机为基础,软硬件可裁剪,适用于系统对功能、可靠性、成本、功耗严格要求的专用计算机系统。实时性是嵌入式系统的基本要求,其次,还要求代码小,速度