基于微博的知识图谱的构建与研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:runnerups
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,个人电脑以及移动终端的普及,越来越多的人开始接触到网络。各种社交平台,例如FaceBook,sina微博,腾讯微博等,极大的改变了人们的生活方式,让网上的信息交流变得越发的频繁和便利。互联网现在已经成为一个全球性的信息资源库,里面包含了大量的信息资源,其中的数据具有海量,复杂和变化性极强等特点,为大数据下的信息检索带来了极大的困难。为了提高检索的质量,实现人与web之间的互动,最终达到预测人的搜索的目的,知识图谱就在这种情况下诞生了。随着社交网络的发展,社交搜索变得越发重要。面对社交平台中大量的数据,构建社交平台下的知识图谱,对于提高社交搜索的质量尤为关键。在本文中,本文构建了基于新浪微博的知识图谱。本文在微博数据的基础上,从这些数据中提取了其中的实体及实体之间的关系,在有了实体以及实体之间关系的数据基础之上,开展了本文的研究工作。(1),本文首先在三元闭包原理的基础上定义了平衡的概念,通过平衡来量化实体之间关系的权重。(2),然后使用改进的PFNET(寻径网络)算法来生成单个话题下基本的知识图谱,本文中称为CKG(紧凑型知识图谱)。(3),对于同一个话题,通过不同时间段抓取的数据,可以构建多个不同的CKG,这些CKG中必然包含相同的实体,然后利用这些相同的实体对这些CKG进行合并,从而一个话题下只有一个知识图谱。(4),对于不同话题下的知识图谱,首先需要找到二者之间的关系,如果二者之中有共同的实体,则可以通过实体合并,如果没有,则需要找出二者实体之间的关系,这分为两种情况,有一种关系和有多种关系着几种情况,对每种情况都要单独处理。在多种关系的情况下,本文主要是通过计算每个关系的介数值,最后只保留介数值最大的边。本文对提出的方式进行了实验验证,通过文中所提方法,可以有效的形成微博下的知识图谱。因此,本文对知识图谱的发展有一定的理论和实践意义。
其他文献
本文研究了城市形象传播中微博信息资源呈现出的议程设置特征和传播方式,在探索其运行规律的同时,寻求新媒体时代以微博为代表的社交媒体中城市形象传播的共同规律,进而利用
万能材料试验机在测量材料力学性能参数的过程中有较好的应用,一般情况下适用于金属、非金属材料、构件以及剪切等力学性能试验。但是,由于万能材料试验机上下式样装置设计、
采用有限元计算同优化分析相结合的方法来确定斜拉桥的最优恒载索力.用一种新型单元--虚拟层合梁单元对结构进行计算,以梁和塔的最大应力最小为目标、用拟牛顿法对索力进行优
研究体育双语教材。要基于本民族文化背景与教学实际,以本土化研究为方向,以试点实验为突破口,探究体育双语教学实施过程中的突出问题,建立本民族的体育双语教学方法和理论体系。
<正> 我们自1990年~1997年收治重型肝炎154例,分别采用中西医结合治疗(治疗组)和西药治疗(对照组),现报告如下。 1 一般资料 154例病人中,亚急性重型肝炎92例,慢性重型肝炎62
从表见代理制度的历史考察为切入点,检讨我国表见代理制度的价值取向.全面剖析了表见代理构成要件三种学说的优点及缺陷,提出了我国表见代理的构成要件.从四个方面来把握我国
考虑一类高阶非线型中立型微分方程(dn)/(dtn)[x(t)-p(t)f(x(t-τ))]+Q(t)g(x(t-δ))=0,t≥t0,其中P,Q∈C([t0,∞),R+),τ,δ∈R+,xf(x)>0,xg(x)>0(x≠0),通过讨论,得到了几个