基于特征向量与核函数相结合的高新技术词汇关系抽取模型研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:zm_627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前大数据时代下,随着人工智能技术的进一步发展,存在于互联网中的各类数据正变得越来越多。这些数据包括离散的无结构的碎片化数据和存在于开放型知识库中的半结构化数据,网络用户或研究人员在使用这些数据之前,必须先要对其进行一定的再组织,即通过信息抽取技术将这些数据转换成结构化的便于使用的数据。信息抽取技术主要包括实体、实体属性、实体间关系等知识的抽取,其中,实体关系对于构建领域知识图谱具有重要意义。“一带一路”视野下,针对一带一路沿线国家的对外汉语教学如今正变得越来越重要,本文重点研究了中文命名实体之间语义关系的抽取,主要进行了以下工作:(1)从多个数据来源网站爬取十二类“一带一路”战略下国家高新技术相关词汇。针对基于有监督的实体关系抽取方法下的两种传统的提取技术:基于特征向量的实体关系和基于核函数的实体关系抽取,分别构造合适的关系实例表达模式,针对预定义的八种实体关系类别,通过实验分析不同方法下的关系抽取性能。(2)针对传统的中文实体关系抽取方法的不足,提出了一种改进后的关系抽取混合模型,将关系实例的平面特征和结构特征进行加权组合,实验过程基于SVM算法,采用多次交叉验证的方法提高分类性能,通过分析不同权重比例下的关系抽取效果证实提出的改进模型的有效性。(3)使用本文提出的改进后的抽取模型,针对十二类高新技术词汇的关联词汇进行实体关系三元组的提取,并构建对应的知识图谱。将提取出的关系三元组应用于“一带一路”沿线国家的对外汉语教学系统的数字媒体库中,可用于提供内容更丰富并且形式更多样化的教学案例。
其他文献
捷裔作家米兰·昆德拉是一位具有强烈存在意识的作家。他的作品弥漫着层层的氤氲。本文旨在结合拉康的镜像阶段理论,阐释其代表作《生命不能承受之轻》中异化生命存在的表征
从政府绩效评估创新实践的多案例数据库分析结果来看,当前我国政府绩效评估创新呈现出一定的规律性,即相对于被模仿的地方政府而言,当前的绩效评估基本上是一种复制性学习;属
<正>目的探讨屈光不正患者验光过程中双眼视功能检查的重要性方法随机抽取门诊57名8-18岁近视屈光不正的患者,男24例,女26例,平均年龄12岁,给予屈光状态检查,同时给予视功能
会议
<正>背景:全球慢性肾脏病(CKD)总的发病率约为8~16%,尽管全球改善肾脏病预后组织(KDIGO)关于CKD的系列管理指南得到了普遍认可,但在延缓肾功能减退方面未能提供特殊指导意见
会议
<正>通过近一段时间的廉政教育学习,结合自己所从事的文化文物和重要旅游景点的工作,我进一步认识到廉政文化建设的极端重要性,只有通过全面的经常性的教育,夯实思想政治基础
实证分析能够为经济理论在现实中的应用做出可行性分析,同时也对政策决定有指导意义。本文通过采用宏观经济数据,对绝对收入假说模型在我国是否成立进行分析,通过OLS估计、2S
地方政府的环境政策执行困境不仅源自环境保护与地方经济发展的矛盾,也与环境问题本身的物理属性、地方环境治理的制度结构以及现行环境保护体制中考核问责和利益协调机制有
<正>由于应试教育和其他因素的影响,传统的语文教学容易忽略人文内容,一味地进行文章分析,乏味的讲解,引起学生语文学习兴趣的消失。自从新课改后,这一趋势已大大改善。然而,
通过对鄂尔多斯盆地晚古生代砂岩类型、岩屑类型和重矿物组合类型的分布及其变化研究 ,将整个盆地进行了分区。这些分区之间具有相似性和继承性 ,同时与砂体展布和古流向也具
<正>英国基础教育从教会控制教育到教师自治,从综合化教育政策到实施全国统一课程,经历了漫长的发展历程才形成了今天的这种体制结构。英国在"人本主义"的思想基础上确立了人