深度学习在简历解析中的应用研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:bin930640
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着文本数据在互联网上的快速增长,海量格式自由的文本简历虽然在工作中给人们带来了便利,但也产生了信息过载的困扰。为了提升非结构化文本简历的解析性能,本文将深度学习技术应用于简历解析中。主要工作如下:1.基于字序列的中文简历解析方法研究。针对浅层神经网络生成词表示的缺陷,构建双向长短时记忆模型(Bidirectional Long Short-Term Memory,BLSTM)对字序列进行建模,获得包含词内部信息的词表示;然后结合BLSTM和条件随机场(Conditional Random Fields,CRF)(BLSTM-CRF)对生成的词表示进行建模并对模型调优;最后使用训练好的模型对非结构化文本简历进行解析。实验结果显示,与传统词向量方案的简历解析模型相比,该方法的F1-score提升了2.31%。2.基于特征融合的中文简历解析方法研究。针对简历解析模型使用单一特征难以提高模型性能的局限性,提出融合多种有效特征来提升简历解析模型性能的方案。本文融合的是传统浅层神经网络生成的语义特征和BLSTM对字序列建模生成的特征。(1)采用concat的方式对这两种特征进行融合,然后使用BLSTM-CRF对融合之后的特征进行建模并对模型调优,最后使用训练的模型对非结构化的文本简历进行解析。实验结果表明,与传统词向量方案、字序列方案的简历解析模型相比,该方法的F1-score分别提升了3.27%、0.96%。(2)引入注意力机制用于融合上述两种特征,并将注意力机制引入至BLSTM-CRF模型中,最终采用训练好的基于注意力机制的BLSTM-CRF模型对非结构化简历进行解析。仿真结果显示,优化后与传统词向量方案、字序列方案、concat特征融合方案的简历解析模型相比,该方法的F1-score分别提升了6.39%、4.39%、3.43%。3.基于深度学习的中文简历解析系统设计。在之前实验和理论基础上设计将深度学习应用于中文简历解析的系统;在网页上展示了简历解析的结果,并将解析的结果应用于构建人物和公司的知识图谱。
其他文献
苯是芳香族的代表,也是工业中非常重要的溶剂和化工原料.简要介绍了苯的结构异构体,着重论述了几种常见的苯的价键异构体的结构及其合成.
目的研究间断温血灌注的心肌保护效果.方法21只孤立灌注的犬心随机分为3组.Ⅰ组行持续温血灌注;Ⅱ组行间断温血灌注,间歇缺血期为10 min;Ⅲ组行间断温血灌注,间歇缺血期为15
从生物学特性、发生规律及综合防治办法上对吉林地区的杨干象进行了细致的观察和实验性的研究,取得了初步效果.
本文通过中、日两国中小学体育课教案的比较,分析两国在集团(集体)教育及体育教学指导思想上的区别。中国体育教学集团教育注重思想品德、集体纪律教育和偏重组织管理上的教
目的探讨支气管动脉栓塞(BAE)的临床应用价值.方法20例大咯血病人急诊行支气管动脉栓塞(BAE),其中单纯性明胶海绵(GS)栓塞10例,GS+SM栓塞10例.结果即刻止血率100%,单纯性GS栓
我国目前规模最大的年产15kt甲基异丁基酮(MIBK)生产装置,日前在吉化集团公司精细化学品厂建成投产,产品纯度达到优级品标准,主要消耗定额达到国际先进水平。
<正> 气厥为中医厥证中一类,有虚实之分。实证多因情志怫郁,恼怒惊骇以致气机逆乱,郁结心胸。蒙蔽清窍而突发昏厥。急诊和门诊常可碰到。本病虽大多数预后良好,但欲使患者迅
期刊
汽车涂装生产为追求环保节能,其生产设备和技术不断创新,新型材料也不断被开发使用。本文主要介绍了汽车清洁涂装技术的发展现状以及与国外先进技术存在的差距,对现阶段广泛
采用表面引发原子转移自由基聚合(SI-ATRP)在室温硫化硅橡胶表面接枝聚甲基丙烯酸甲酯(PMMA)。通过衰减全反射傅立叶变换红外光谱(FT-IR/ATR)、X射线光电子能谱(XPS)、接触角