基于深度神经网络的基础教育地理知识库的构建

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:binwuwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,类人智能发展迅速,已有相应产品应用于教育、医疗等行业,如针对初等教育考试问题的日本Todai Robot项目和致力于智力问答并拓展到医疗领域的美国IBM的Waston项目。完备和高质量的知识库决定类人智能问答系统的智能水平,在国内,以“文综”为代表的基础教育资源,蕴含丰富的知识,因此构建基础教育资源知识库服务于类人智能问答有重要意义。论文依托863项目“面向基础教育的类人智能知识理解与推理关键技术”(2015AA015403),以地理学科为研究对象,使用深度神经网络完成关系抽取任务并通过多数据源融合方法初步构建知识库。论文主要包括以下几个部分:1)通用关系类型体系和语料库无法满足地理领域,人工构建地理实体关系类型体系和语料库,为关系抽取提供数据基础。分析通用关系类型体系和《基础地理信息要素数据字典》定义了地理实体关系类型体系。分析《中国大百科中国地理》文本特点,制定标注规则,在GATE平台下构建语料库。2)将关系抽取定义为基于字向量的字序列标注的问题,建立端到端的神经网络,使用字特征、句子特征以及提出的类别特征抽取实体关系,为知识库构建提供数据源。字的标注依赖于其相邻的字,基于滑动窗口机制,使用普通神经网络提取字特征,即局部特征。决定字的标注的信息存在句子中,卷积计算可合并局部特征,最大池化可凸显局部特征,使用卷积神经网络提取句子特征,即全局特征。句子中的类别关键词能代表句子含义,由于关键词之间无上下文关系,使用普通神经网络提取类别特征,即更显著的全局特征。论文将准确率、召回率以及F值作为衡量关系抽取性能的指标。3)针对百科数据特点,设计基于文本相似度的算法,解决多数据源融合中实体对齐、属性对齐及属性值冲突问题,为基于本体的知识库提供实例化数据。百科数据特定领域的文章中,稀有词现象普遍,逆文档频率的分类特征明显,文档向量考虑了词序和上下文特点,包含更多语义信息,应用基于词频-逆文档频率和文档向量方法实现实体对齐。基于人工协同编辑的百科数据属性名或值表达方式因人而异,针对属性名大都由一到两个词组成的特点,设计基于词向量的方法实现属性对齐。针对属性值大部分由句子表示的特点,设计基于文档向量方法解决属性值冲突问题。
其他文献
法属越南时期的华侨政策对我国在越华侨影响颇深,法殖民当局为开发掠夺越南的资源,对华侨加以借重和利用,为满足自己的统治需要不断调整华侨政策,这在出入境、税收、社团、华
社会保障制度是国家对于社会人民的福利的安排,能够起到稳定社会、促进社会发展的重要作用,同时还能调节社会的公平。改革开放以来,我国的社会保障制度在不断的发展,取得了显
随着科技的进步和全球经济一体化进程的加快,企业的外部环境变得日益复杂,竞争越来越激烈。技术对企业内外部环境的影响程度越来越大,技术发展战略已经成为企业保持快速发展
随着我国的经济体制改革以及市场机制变革的扎实推进,我国的劳动关系已基本形成为市场化的劳动关系,在劳动关系的影响因素中,不仅仅是市场的调控作用尤为重要,且政府也通过适
清朝入关前这段时间正是满洲社会过渡到专制集权,统治范围不断扩大的特殊时期,在其经济持续发展、领土不断扩张的影响下,满蒙联姻以及满蒙联姻所带来的各蒙古部落与爱新国及其后的大清国之间的礼尚往来,满蒙联姻的婚宴的宴会规模和宴会饮食,宴会娱乐环节等都发生了改变。通过《满文老档》及《清初内国史院档》相关记载,发现各蒙古部落与满洲政权间的交往,从努尔哈赤时期各蒙古部落进献牛羊等肉制品、奶制品,爱新国回赠布匹、
本文基于政治锦标赛理论的视角,以官员的政府补贴行为的实证研究检验了地方政府的“政治观”。本文基于中国上市公司2008~2014年的政府补贴和财务数据,考察了地方官员在晋升
《杰出的切斯特·朗宁:中国骄子》是加拿大阿尔伯塔大学前副校长、著名历史学家布莱恩·埃文斯教授为伟大的外交家、中加关系的奠基人切斯特·朗宁大使所立之传,全书讲述了朗
语言和文化之间是一种相互依赖的关系。没有语言,文化无可谈及;离开文化,语言也不复存在。虽然文化意识是学生综合语言运用能力的重要组成部分,但现今传统英语教学模式仍占据主要地位。它过度强调词汇和语言在英语学习中的首要性,不重视跨文化教育,导致学生跨文化意识薄弱。带着这样一个问题意识,笔者尝试以图式理论为基础,研究英语阅读中培养跨文化意识的策略。本研究采用问卷调查法,观察法和实验法,对河北省某中学七年级
随着计算机图像在日常生活与生产中的广泛运用,人们对图像分析、检索和分类管理的需求与日俱增。由于图像信息内含的非结构化特点,给相应信息分析处理带来极大困难,因此,图像
全球变暖和能源短缺是人类社会可持续发展面临的两个严峻挑战。以再生能源制备的氢气为还原剂,通过热/光催化过程,将温室气体二氧化碳转化为燃料或化学原料,实现热能/光能向