基于深度学习和迁移学习的领域自适应中文分词

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:tansb87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高专业领域中文分词性能,以及弥补专业领域大规模标注语料难以获取的不足,该文提出基于深度学习以及迁移学习的领域自适应分词方法。首先,构建包含词典特征的基于深度学习的双向长短期记忆条件随机场(BI-LSTM-CRF)分词模型,在通用领域分词语料上训练得到模型参数;接着,以建设工程法律领域文本作为小规模分词训练语料,对通用领域语料的BI-LSTM-CRF分词模型进行参数微调,同时在模型的词典特征中加入领域词典。实验结果表明,迁移学习减少领域分词模型的迭代次数,同时,与通用领域的BI-LSTM-CRF模型相
其他文献
2019年,我国《政府工作报告》首次写入氢能源,要推动加氢设施建设。长三角区域具备发展氢能的基础和优势,在当前背景下,需要抓住机遇、明确任务、加快布局,推动长三角区域成
期刊
昆明钢铁股份公司炼铁厂始建于1939年,1998年从卢森堡引进高炉设备,经国内技术改造,达到国内同类高炉先进水平的六号炉投产出铁,自此昆钢炼铁厂走向了高炉大型化、现代化的冶炼之
分析超临界机组汽泵的多种抢水现象,并提出处理意见。
韩国清溪川全长11公里,自西向东流经首尔市,流域面积51平方公里。由于大量的生活污水和工业废水排入河道、河床硬化、砌石护坡、裁弯取直以及水泥板封盖、高架桥建设等原因长期
报纸
运用信息技术,可以拓宽作文的途径,使学生对作文感兴趣,激发学生的写作热情,从而提高作文教学效率。
详细推导了惯性测量单元(IMU)精度与全球导航卫星系统(GNSS)接收机信号跟踪环路误差之间的数学模型,分析了IMU辅助的高动态载波跟踪环路误差精度,比较了不同精度IMU辅助GNSS
1950年代苏联关于审美本质的讨论,标志着苏联马克思主义文论进入了一个新的发展阶段,它由长期以来对文艺的简单化和片面化的理解,转入了在更广泛的视野中进行阐释。其中社会
为加强亚太地区存可持续生产与消费领域的交流与合作,促进中国节约型社会建设,由联合国亚太经济社会理事会(UN/ESCAP)与中国国家发展和改革委员会联合主办,中国标准化研究院中
根据欧盟近日公布的可再生能源报告,2009年欧盟新增发电装机容量的62%来自可再生能源,可再生能源发电量占当年欧盟总耗电量的19.9%。欧盟2009年的总耗电量为3042太瓦时(TWh),其中19.9%
目的:美洛西林严重不良反应与相应解决措施。方法:查阅国内各大医院相关原始病例报道与专家文献综述,剔除重复病例并选择符合研究不良反应定义的相关原始病例报道进行分析,对