基于知识图谱构建人物关系的设计与实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:iorikof1107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
公安情报工作的重点是关注人物、组织、账号之间的关系,在实际工作中往往需要通过一个姓名获得与之相关的所有信息,比如某人最近和哪些人联系过,某人参加过哪些活动,某人使用过哪些社交账号等,这些需求通常需要人工在海量信息中查找答案,于是论文提出构建一套描述了人物之间的关联关系的知识图谱,使得通过查询知识图谱中人物关系,就能获得人物的基本信息、人物相关活动轨迹信息、人物的相关人物信息等。当然,知识图谱应用在查询人物关系上为情报工作带来了便利,但是如何设计和构建知识图谱却是一个难点。然而,现存的许多研究工作都假设了原始数据已经清洗完毕,人物关系已经构建成为三元组数据,甚至知识图谱已经构建完毕,而主要研究知识图谱的分析方法和应用场景。于是,论文的主要工作集中在从原始数据到形成人物知识图谱的过程上,而对于人物知识图谱应用只需要满足查询人物关系的要求。对于设计构建人物关系的知识图谱,主要存在三个难点问题:一、原始的数据量非常大而且数据结构完全不一样,如何从中抽取到人物、组织、账号等关注的对象,以及如何判断两个人物存在关系。二、针对知识图谱的更新问题,如何判断新加入的人物是否已经存在于知识图谱中,而且如果对于已存在的人物又如何合并人物相关信息。三、人物关系包含了人与人、人与组织、人与网站、人与账号等上千类关系,如何设计每种对象的数据模型,既能描述对象基本信息,又能描述对象之间关系。本文的主要工作有:(1)在本体建模的基础上,提出了人物关系建模方法。首先根据域、类、属性、实体的定义,详细设计了这四类数据结构,并指导创建了人物属性集合、人物关系集合,并实际验证了该建模方案的可行性。(2)在自然语言分词技术基础上,提出了融合多正则表达式的人物实体抽取技术。通过实验比较了中科院分词和哈工大分词的中文分词效果,分析了两种分词技术的不同特点。同时,实验证明了结合多正则表达式可以提高实体抽取效果,特别适用于识别账号类实体。(3)提出了基于知识图谱的人物关系搜索、语义搜索、场景化搜索这三种应用方案,并对比了三种方案的应用场景。
其他文献
在目前对财政性科研经费的管理方式和相应的会计核算模式下,科研经费投入方的负债状况得不到真实反映,项目依托单位不能提供真实完整的会计信息,财政性科研经费的核算在不同
<正>篆刻作为中国本土文化生成的一种艺术,到明清之际,其艺术价值日益为人所重,小小一块印章之上承载着中国人的审美情趣、文化内涵。随着中国文化热的升温,近年来篆刻艺术市
介绍了地面无人侦察车辆的国内外的发展现状和趋势,以地面车辆环境感知技术为重点,对基于三维信息的越野环境可通行性分析、融合地面环境特性的高精度定位定向、多传感器信息
<正>党的十九大作出了中国特色社会主义建设进入新时代、我国社会的主要矛盾已经转变为人民日益增长的对美好生活需要和不平衡不充分的发展之间的矛盾的政治论断。本文通过分
采用新的方法推导出非均匀介质中非对称耦合传输线的传输矩阵 (T参数 )解析表达式 ,给出了以正规模式参量描述的 T参数表达式。所得 T参数表达式形式简明 ,物理概念明晰。通
为达成新时代中国石化对一流能源化工公司的愿景,加快新兴业务发展,实现中国石化信息化"十三五"规划所确定的目标,推进ERP大集中全覆盖,创造"石化速度",ERP系统被越来越多地
高浮雕凸花和立体装饰是宋代金银器的特色之一。今天所见的实物多为南宋作品,但仍有种种迹象显示,它们的出现可能会早到北宋。这种装饰在宋代的流行,既体现了工艺的演进,又代
本文讨论遵义方言的语音特点和新老差异。包括:音系特点;文白异读;连读变调;新老差异。
目的观察外固定支架联合VSD技术治疗下肢严重骨折并皮肤缺损的护理疗效。方法采用资料查证法,选取本院2013~2014收治的行骨科外固定支架患者80例为对照组,根据临床观察记录和
本文讲述了"易拉罐形状和尺寸的最优设计"问题的命题、建模和求解,评述了学生递交的论文中的优缺点,提出了若干建议.