论文部分内容阅读
种类繁多的社交网络(Social Network Sites)成为近些年来热度最高的网络应用,而其中大量的多媒体信息引起了研究人员的兴趣。针对社交网络中多媒体数据的研究主要关注于两点:1.如何合理的对社交网络中的多媒体数据进行有效的数据挖掘。多媒体数据蕴含了用户大量的特性信息,通过对这些数据进行挖掘,可以对用户的生活习惯、兴趣爱好进行推测,并进行有针对性的信息推荐,从而增强社交网络的用户体验。2.如何对快速增长的社交网络多媒体数据进行有效管理。随着用户数量的增长,社交网络中的多媒体数据呈指数级增长,急需一些行之有效的方法对海量的网络数据进行管理,包括存储和查询等操作。针对问题一,本文在社交网络数据挖掘中加入了基于图像内容信息的数据挖掘,并创新性的将图像中的人物关系及文本标签引入其中,实现更加具有判别力关系测算方式,深化了用户历史操作记录的图数据挖掘算法。在链路式信息推荐方向上,本文提出了加权深度优先算法,有效的解决了好友推荐及信息推荐问题;在聚类式信息推荐方向上,本文提出了多知识网络协同学习算法,能够准确的查找社交团体中的核心成员,进行聚类式信息推广。针对问题二,本文为了实现海量多媒体数据有效索引和快速检索,在传统的局部敏感哈希的基础上,引入了海明编码技术,实现了高维数据线性时间索引,降低了多媒体数据检索的时间复杂度,并且针对当前流行的分布式系统做了针对性的优化,利用局部敏感哈希的特性,建立多哈希桶分布部署,使得网络用户实时检索多媒体数据成为现实。由于网络数据的多样性,导致在对其进行数据挖掘时,要使用不同的方法,这样就会构建意义不同的知识网络。如何将这些网络进行最有效的融合具有很大的挑战。本文通过对用户基本信息进行数据挖掘,形成了第一层无偏置加权用户网络;通过加权深度优先算法构建了用户交互网络,并且对用户之间的关系密度进行了加权,构成了第二个知识网络;通过基于图像内容信息数据挖掘,建立了用户网络,且对其中的二人连接、多人连接(可以存在环)的关系密度进行了加权,构成了第三个知识网络。通过基于图的最大置信融合算法,在无监督的条件下将以上三种学习方法得到的知识网络进行了融合。实验结果表明,这种融合方式是高效而可行的。最后本文设计并实现了基于挖掘结果的社交网络图像中人脸自动标注系统,通过对图像中的人脸进行检测、识别,为图像推荐一组高可信度的人物标签;设计并实现了基于加权深度优先的好友推荐及信息推荐系统,计算社交网络中用户的关系密度;设计并实现了基于多知识网络协同学习的聚类式信息推广系统,查找社交团体中的核心用户,进而实现聚类式的信息推广。