【摘 要】
:
目前存在的中文命名实体识别方法依赖于大量标注数据,但是某些领域标注数据的获取成本十分高昂.通过引入迁移学习技术,降低了实体识别模型对于大量标注数据的需求.论文从大规
【机 构】
:
上海理工大学光电信息与计算机工程学院;
【基金项目】
:
国家自然科学基金项目(61772342、61703278)资助
论文部分内容阅读
目前存在的中文命名实体识别方法依赖于大量标注数据,但是某些领域标注数据的获取成本十分高昂.通过引入迁移学习技术,降低了实体识别模型对于大量标注数据的需求.论文从大规模非结构化文本数据出发,利用双向循环神经网络构建语言预测模型,将其作为迁移学习源模型;同时,基于上下文特征的字符级向量生成算法迁移源模型知识至实体识别模型,最终构建出迁移学习模型:Trans-NER.实验结果显示,提出的模型表现优于其他实体识别模型.
其他文献
目的:探讨甲氧明联合麻黄碱甲氧明对老年胃癌全麻后低血压的预防作用研究。方法:选取择期行全麻下腹腔镜胃癌根治术老年患者70例,患者或家属签字同意,按简单随机法分组,对照组3
分析了李萨如图形的形成机理,用EWB演示不同频率比、振幅比和初相位条件下的李萨如图形,能使学生直观感受到图形的合成过程及图形的绕行方向,从而提高学生对李萨如图形的认识
借助于热力学分析和氧化性能实验,研究了高炉炉缸用炭砖在空气气氛下的氧化行为和氧化动力学。结果表明,炭砖的质量损失主要来自于石墨C氧化,质量损失量随温度升高、保温时间
江泽民的文化思想是在马列主义、毛泽东思想关于文化建设理论的基础上,对邓小平关于精神文明建设理论的最好继承和创造性发展。当代中国社会主义建设的实践和国际文化发展的现
文化建设事业始终是构建社会主义和谐社会体系的基础保障,同时也是实现中华民族伟大复兴的基础保障,必须重点践行。现阶段,随着我国社会主义核心价值观体系的不断健全与发展,
目的:分析血细胞分析仪测定血小板计数的主要影响因素。方法:选取该院2015年1~7月行健康体检的50例志愿者,分别采集其静脉血与末梢血行血小板计数测定,同时依次采用手工法与
国家治理是我国经济社会转型面临的核心问题,而国家审计则是国家治理体系中具有"免疫系统"功能的重要组成部分。目前,学者们对于国家治理的本质以及国家审计与国家治理的关系
在界定网络谣言概念和特点的基础上从网络谣言自身、网民群体和大众传播媒介三个方面具体探讨网络谣言扩散的动力,包括网络谣言价值的易逝性、建构话语权的渴望、安全的需要
一支富有进取心的青年科研人员队伍对于科技创新至关重要。基于一项对高校和科研院所青年科研人员的全国抽样调查数据,研究了青年科研人员职业抱负情况,并分析了影响职业抱负
目的 :研究不同提取工艺对连翘药材中连翘苷的影响。方法 :用不同提取工艺 (水提、醇提、半仿生提取等 ) ,提取连翘 ,得到不同的提取物 ,用HPLC法测定各连翘苷总量 ,计算提取