社交网络中的多媒体数据挖掘

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liqiran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
种类繁多的社交网络(Social Network Sites)成为近些年来热度最高的网络应用,而其中大量的多媒体信息引起了研究人员的兴趣。针对社交网络中多媒体数据的研究主要关注于两点:1.如何合理的对社交网络中的多媒体数据进行有效的数据挖掘。多媒体数据蕴含了用户大量的特性信息,通过对这些数据进行挖掘,可以对用户的生活习惯、兴趣爱好进行推测,并进行有针对性的信息推荐,从而增强社交网络的用户体验。2.如何对快速增长的社交网络多媒体数据进行有效管理。随着用户数量的增长,社交网络中的多媒体数据呈指数级增长,急需一些行之有效的方法对海量的网络数据进行管理,包括存储和查询等操作。针对问题一,本文在社交网络数据挖掘中加入了基于图像内容信息的数据挖掘,并创新性的将图像中的人物关系及文本标签引入其中,实现更加具有判别力关系测算方式,深化了用户历史操作记录的图数据挖掘算法。在链路式信息推荐方向上,本文提出了加权深度优先算法,有效的解决了好友推荐及信息推荐问题;在聚类式信息推荐方向上,本文提出了多知识网络协同学习算法,能够准确的查找社交团体中的核心成员,进行聚类式信息推广。针对问题二,本文为了实现海量多媒体数据有效索引和快速检索,在传统的局部敏感哈希的基础上,引入了海明编码技术,实现了高维数据线性时间索引,降低了多媒体数据检索的时间复杂度,并且针对当前流行的分布式系统做了针对性的优化,利用局部敏感哈希的特性,建立多哈希桶分布部署,使得网络用户实时检索多媒体数据成为现实。由于网络数据的多样性,导致在对其进行数据挖掘时,要使用不同的方法,这样就会构建意义不同的知识网络。如何将这些网络进行最有效的融合具有很大的挑战。本文通过对用户基本信息进行数据挖掘,形成了第一层无偏置加权用户网络;通过加权深度优先算法构建了用户交互网络,并且对用户之间的关系密度进行了加权,构成了第二个知识网络;通过基于图像内容信息数据挖掘,建立了用户网络,且对其中的二人连接、多人连接(可以存在环)的关系密度进行了加权,构成了第三个知识网络。通过基于图的最大置信融合算法,在无监督的条件下将以上三种学习方法得到的知识网络进行了融合。实验结果表明,这种融合方式是高效而可行的。最后本文设计并实现了基于挖掘结果的社交网络图像中人脸自动标注系统,通过对图像中的人脸进行检测、识别,为图像推荐一组高可信度的人物标签;设计并实现了基于加权深度优先的好友推荐及信息推荐系统,计算社交网络中用户的关系密度;设计并实现了基于多知识网络协同学习的聚类式信息推广系统,查找社交团体中的核心用户,进而实现聚类式的信息推广。
其他文献
多维分析是数据仓库及联机分析处理中最主要的数据处理技术。传统的多维分析是维值为确定的一种分析方法。在实际分析过程中,由于环境的复杂不确定,分析人员常常提出一些维值
多目标、多约束规划问题一直是最优化研究领域中的难题。由于在求解、优化过程中,必须同时考虑资源约束,使问题的复杂性大大增加。  此类问题在现实中具有较多的应用场景,例如
TTCN-3是一个灵活且功能强大的测试套描述语言,它适用于各种交互系统的说明。目前,TTCN-3已经被广泛地应用于协议测试(包括移动和互联网协议)、服务测试、基于平台的CORBA测
众所知周,流程图在日常工作生活中发挥了重要的作用,所以制作流程图的工具就显得特别重要。而目前已经产生的流程图制作软件大都工作在操作系统之上,这些软件使用起来很方便,
随着空气污染的日益加剧,空气质量监测已引起政府、学术界和工业界的关注。空气污染物中,PM2.5由于可严重影响人体身体健康尤为大家所关心。本文设计与实现了用于监测城市PM2.5
随着互联网和移动终端应用的发展,现如今越来越多的人喜欢在移动社交网络上分享各类活动和信息。同时定位技术的发展、基于位置的社交网络(LBSNs)使得人们更容易在移动应用中
随着全球信息化的飞速发展,具有松耦合性及高灵活性特点的面向服务架构(SOA)逐渐成为企业软件架构的趋势。作为信息系统中不可或缺的组成部分之一,报表系统一般针对某个企业
近年来所提出的谱聚类算法是一种较为流行的聚类分析方法。谱聚类算法建立在谱图理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类,且能收敛于全局最优
社会-经济系统结构和动力学分析和建模是复杂系统研究的重要课题。近年来复杂网络研究兴起,自然界和人类社会中结构不规则、复杂的、时间上动态演化的网络成为关注热点.大量分
随着21世纪以来互联网的普及以及计算机运算和处理性能的大幅度提高,全球进入信息化时代,信息也成为了当今社会最重要的商品。在信息获取越发迅速的同时,信息的安全保密问题也越