【摘 要】
:
随着移动设备的普及和互联网技术的不断发展和突破,数据量呈指数级增长,整个互联网传播数据不再是单一的文本数据,而是由多样化形式数据共存,如:图像、音频和视频等。互联网本质是分享、互动、虚拟、服务,实际上这四项都离不开社交功能,其背后的本质就是“数据的流动”。互联网让数据在人和设备二者之间产生了自由流动,通过数据把世界连接了起来,这是互联网带来的革命性变化,它让人类实现互联,分享信息,发现兴趣,共同受
论文部分内容阅读
随着移动设备的普及和互联网技术的不断发展和突破,数据量呈指数级增长,整个互联网传播数据不再是单一的文本数据,而是由多样化形式数据共存,如:图像、音频和视频等。互联网本质是分享、互动、虚拟、服务,实际上这四项都离不开社交功能,其背后的本质就是“数据的流动”。互联网让数据在人和设备二者之间产生了自由流动,通过数据把世界连接了起来,这是互联网带来的革命性变化,它让人类实现互联,分享信息,发现兴趣,共同受益。互联网数据是由人类产生,这些数据注定要被人类消费掉,因为这些由人类产生的多模态数据往往会有很多有趣内容或有用知识,这使得数据挖掘的可用性和有效性在学术界和工业界得到广泛的研究和认可。而社交媒体能够产生大量的文本和图像数据,通过对社交平台多模态数据进行挖掘,不仅能够很好的理解用户的兴趣或意图,而且对于多模态数据的语义表达和融合也起到了非常重要的作用,这也正是本文研究的重点。根据多模态数据间存在着紧密语义关联这一特性,本文主要以社交媒体用户行为数据中的兴趣概念为基点,通过对用户的文本和图像数据进行分析,结合深度学习的方法将多模态数据的语义特征进行融合表达,并针对多模态数据融合进行了深入研究。文本的研究工作主要包括6个章节:第1章引言:研究国内外社交媒体用户兴趣建模和用户兴趣识别研究现状及发展趋势方面文献梳理工作,主要了解到国内外关于社交媒体用户兴趣建模存在的数据类型单一性问题,并探讨了本文的选题背景和选题意义,并针对选题背景和选题意义提出了研究方法、研究思路、研究内容和研究创新。第2章相关理论与工作概述:阐述了社交媒体的相关概念和信息传播方式,针对国内社交媒体微博用户图像和文本数据特点进行相关性分析,并进行数据采集和清洗工作,主要对微博中的用户文本和图像两类数据进行用户兴趣建模定义、模型构建和用户兴趣识别工作。第3章基于Bi-RNN和注意力机制融合的博文用户兴趣建模:针对社交媒体中的用户博文,提出一种新的微博短文本训练模型。本章针对在原有传统用户微博文本语料稀疏和不足的情况,引入了微博用户兴趣标签语义信息,让博文向量模型能够获得额外的共现信息,使整个词向量模型能够更好的识别具有语义关联的词语,让语义词在向量空间中更相似,解释性更好;使用双向循环神经网络提取高层特征并引入注意力机制,该方法具有更好的文本语义特征提取和表达能力,很好的对微博文本用户兴趣模型构建和识别,并对用户进行兴趣分类。第4章基于CNN的微博图像用户兴趣建模:提出一种基于卷积神经网络的单模和单模组合图像融合的用户兴趣分类模型。针对社交媒体中微博用户分享的单模图像和单模组合图像,构建了一种单模组合图像检测方法。然后通过使用卷积神经网络和池化的方法得到图像特征表达,将池化后的矩阵平铺作为图像的全局表达,从而更有助于微博中图像用户兴趣分类。第5章基于多模态数据融合的微博用户兴趣建模:提出了一种基于多模态数据的微博用户兴趣分类模型,通过文本和图像语义的融合,能够很好的发现或预测用户的兴趣类别。这种方法主要利用图像的特征的表达与文本中双向循环神经网络的所有隐藏状态计算内积,然后再接softmax激活函数获得每个隐藏状态的分布,利用所有的隐藏状态加权求和,最后将结果加权拼接起来用进行分类,并且能够提高用户兴趣分类的性能。第6章研究总结与展望:对全文研究内容进行总结和展望,总结研究成果和提出研究相关结论,分析研究不足,并提出未来的可行性研究建议和进一步研究方向。
其他文献
随着互联网和通信等技术的发展,电子地图的相关应用已经成为人们日常生活中不可或缺的一部分。然而随着用户需求的升级,以栅格瓦片地图为代表的电子地图在用户交互性、样式灵活性、图片分辨率等方面的局限性越来越明显。将矢量数据和瓦片技术相结合构造矢量瓦片地图,可以较好地弥补栅格瓦片地图的不足。如今,矢量瓦片地图的相关研究日渐成为网络电子地图发展的重要方向和研究热点之一。但是,现有的矢量瓦片地图自身也存在一些不
这篇论文是关于康德宗教哲学,我试图用调和性的维度进行解读,所谓调和性维度是基于康德批判哲学现象与物自体的二元对立,康德运用知性思维方式去试图调和其二元对立的哲学体系的一种尝试。康德宗教哲学虽然研究者众多,但是基本都是将其宗教哲学当作其道德哲学的补充,这样并没有突出康德宗教哲学对于其整个批判哲学体系的重要性。本文认为康德宗教哲学在调和性维度的视角下可以彰显其在康德整体哲学体系中的重要地位,即它并不属
癌症的治疗是21世纪的重大挑战。针对癌细胞的特征进行抗肿瘤治疗,能高效率地消灭癌细胞,同时减轻毒副作用。不受控的细胞增殖是癌症的基本特征之一,细胞周期蛋白依赖性激酶(CDKs)是细胞周期关键调控枢纽,因此成为有吸引力的抗肿瘤靶点。线粒体是细胞的能量工厂,也是细胞死亡的调控中心,根据肿瘤细胞与良性细胞线粒体之间的差异,可以选择性杀死肿瘤细胞。本工作以CDKs和线粒体为研究对象,设计了系列抗肿瘤化合物
新材料的发现与发展在改善人类生活和科学技术进步中发挥着重要作用。石墨烯的出现在材料科学领域引发了一场空前的变革。与其他材料相比,二维材料在光学、电学、力学和热学等领域具有许多独特的性质,为能源、催化、集成电路、复合材料以及量子通信等关键领域的发展起到了重要的推动作用。研究人员发现,高质量的二维材料不仅有助于提升相关领域的应用性能,而且对于二维极限下新奇物理现象的探索至关重要。在二维材料的制备方法中
龋齿是一种广泛存在的慢性细菌感染性疾病,严重影响人们的生活质量。变异链球菌是目前公认的与牙齿表面软硬组织破坏密切相关的主要致龋菌。其产酸能力和耐酸性使之在菌斑酸化和釉质的脱矿中起重要作用。细胞表面蛋白抗原c(PAc)是一类存在于细菌菌体表面和细胞壁中的糖蛋白,是细菌的主要毒力因子,可以介导变异链球菌对牙齿表面的蔗糖非依赖性黏附。PAc作为疫苗抗原已被用于诱导特异性抗体产生和抑制致龋微生物定植。然而
离子液体,固态电解质、离子嵌入型材料等是典型的超浓离子体系,其广泛应用于当今高能量密度能源器件中。因此,对超浓离子体系电化学特性的研究也日益增多。界面离子分布(双电层结构)、传输及电荷转移等是决定电化学器件性能的关键因素。在这些方面,超浓离子电化学体系与传统电化学体系有着根本的区别。本论文就此开展探究,主要结果总结如下,1.离子尺寸效应对于纳米盘电极上电化学性质的影响材料的纳米化已经成为目前能源器
个体与群体的关系问题,始终是政治哲学所关切的重要主题。如何认识和处理这一问题,既涉及群体的存亡兴衰,又关乎个体的生存境遇与命运。对近代中国而言,在西方文化的冲击与影响下,中国社会的传统群己关系面临着如何向现代转型与变革的艰难选择。作为近代思想的巨子,梁启超的政治思想无疑具有极大的代表性。特别是他关于群己关系的理论,显然是其中的重要内容。梁启超将“自由”、“民权”、“群治”、“合群”等大量涉及群己关
缺血性脑卒中是一种具有高发病率、高致死率的复杂疾病,尽管已经开展了大量通过调控兴奋性中毒、氧化应激、细胞凋亡、炎症反应等方面进行神经细胞保护的临床干预治疗研究,但一些在模式动物实验中获得较好效果的方案在临床转化试验中均以失败告终;同时重组组织型纤溶酶原激活剂阿替普酶(rt-PA)又因其极短的治疗窗口而难以在大量患者中使用。因此进一步深入解析脑缺血再灌注的发生发展过程和损伤机制,寻找有效的防治药物靶
现实空间见证了社会事件发生的事实,但很难提供相关信息实现社会事件发展状态的预测。随着互联网的高速发展,以互联网为载体的虚拟空间已经基本形成。现实个体通过参与社会事件,并在虚拟空间中分享、传播社会事件相关信息,将社会事件映射到虚拟空间中,从而使两者之间的关联性逐步增强。虚拟空间记载着事件发生过程,借助虚拟空间中相关信息来量化、分析虚拟空间与现实空间之间的关联性,可以预测社会事件在现实空间的发展状况,