网络社区事件知识图谱构建

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:LJ619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的出现使得人们可以更加方便地获取信息,然而随着大数据时代的到来,如何从大规模的异构信息中获取知识成为了一个难点。自Google公司提出知识图谱的概念以来,利用知识图谱的相关技术,以结构化的形式来优化知识的存储和表示已经成为一种趋势。随着知识图谱规模和应用领域的不断扩大,如何获取一个实体更深层次信息,以及构建出更具有实体立体画像的知识图谱成为了目前知识图谱研究的一个重要方向。以事件类型的实体为例,提出并构建了一个以事件为中心,通过事件要素进行关联扩展的网络社区知识图谱。为了完成知识图谱的构建,首先从网络社区信息中抓取了百科词条和新闻报道等具有较高可信度的数据,然后建立了一个基于LSTM和注意力机制的事件抽取模型(LAL)以识别其中的事件及相关要素,最后在这些事件要素的基础之上完成以事件为中心的网络社区知识图谱构建。为了让知识图谱涉及的相关知识更加完善,还使用了基于词向量最大余弦及逻辑斯蒂回归的相似度算法(Cosine-Logistic)融合其它知识库的知识以补充实体的基础属性和关系。实验证明,LAL和Cosine-Logistic模型在数据集及实际使用中都取得了较好的效果。利用Neo4j数据库的数据统计和图形化查询接口与CN-Dbpedia等知识库进行的比较,说明事件知识图谱补充了通用型知识图谱关于事件类型实体的知识缺失,能够有效的记录一个事件实体的发展历程。这对于具体了解某个事件和分析事件的后续发展及影响具有较大的参考价值。
其他文献
【正】 固定资产和流动资产都存在无形损耗马克思在《资本论》中所说的无形损耗,指的是固定资产。笔者在实践中体会,不仅固定资产存在无形损耗,而且处于储备、生产和销售过程
<正> 我们对387名交通警察进行了心电图的检查,结果发现其中有13名交通警察的心电图有异常改变,占总被检人数的3.4%。异常心电图改变主要见于各种类型的心律不齐(7名),S-T段下
分支预测精度是影响当代处理器性能的重要指标,在近十年内一直是学术界和工业界的研究热点。为给不同应用场合的处理器动态分支预测器设计提供性能参考,针对处理器架构设计中
从当前我国财政改革的总体运行状况看,虽然取得了重大进展,但财政管理相对滞后,财政支出问题突出。本文在分析我国财政支出存在问题的基础上,提出了我国财政支出的改进原则和
文章详细分析了基于五类UTP电缆的千兆以太网1000BASE-T的网络协议与实现技术,对1000BASE-T具体实现的各个环节进行讨论。
目的:应用NEMA NU2-2001标准测试PET/CT的PET成像质量、衰减和散射校正精度性能指标。方法:采用NEMA IEC/2001PET人体体部模型,按照NEMA标准的测试方法,对PET成像质量和衰减和散射
跳水运动员的运动表现极大受到日常训练状态和竞技心理状态的影响,通常影响竞技心理状态的不可控因素较多,而对日常训练状态影响较大的因素则相对较为稳定和可控,包括运动员因素、教练员因素和客观因素等几大类因素。本研究以问卷调查法为主,选取包括运动员人格因素、教练员运动领导行为及运动员-教练员关系、运动员训练比赛满意感四个变量对其相互之间的关系进行一次探索性研究,旨在通过了解运动员人格因素,教练员可以有针对
介绍了以太网端口自协商标准,重点分析了光口自协商与电口自协商的工作原理和区别,并给出了具体的以太网端口协商案例。
<正>目的探讨乙二胺四乙酸二钾(EDTA---K2)抗凝剂致血小板计数假性减少原因分析及避免措施,采用SE—9000全自动血细胞分析仪及以EDTA—K2为抗凝剂的真空负压采血管,检测抗凝
会议
<正>目的:采用高通量透析治疗慢性肾功能衰竭顽固性皮肤瘙痒的临床观察.方法:12例患者,采用高通量性7~60滤过器做维持性常规透析,透析机为容量控制超滤,血流量OB为250~300ml/mi
会议