基于深度学习的简历信息实体抽取方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:awaydown
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的简历信息实体抽取方法泛化能力差、难以维护的问题,提出一种基于深层神经网络的简历信息实体抽取方法。经过数据清洗、分词等预处理将非结构化的简历文本信息处理为词序列,通过由Word2Vec在大规模语料库以无监督方式训练得到的词向量表,将每个词映射为低维实数向量,由双向LSTM层融合待标注词所处的语境信息,输出所有可能标签序列的分值给CRF层,由其引入前后标签之间的约束求解最优标签序列,以随机梯度下降法训练该模型,辅以Dropout防止过拟合。实验结果表明,该方法提升了相应的解析标注性能,提高了泛化能力。
其他文献
为准确提取代表视频镜头主要内容的关键帧,减少对视频操作的数据处理量,结合关键帧提取过程中需要人为预先设定阀值以及存在冗余等情况,提出一种基于聚类方法改进的关键帧提取算法。使用层次聚类方法获得初始聚类结果,利用人工免疫聚类方法对聚类结果进行优化,提取相应数量的关键帧。实验分析结果表明,该算法在聚类过程中得到了更稳定的聚类结果,提取出的关键帧具有很好的代表性,有效降低了冗余度。
我家耕种的荒地离家足有二十里,我和爹锄了一天地往回赶时,看见了那只叼去我家一只鸡的红狐就在不远的沙丘上站着,眨着水漉漉的两只菱形眼睛默默地望着我们。我的心里腾起了
以多媒体技术为依托进行知识传播的体育教学领域,计算机信息技术的应用不可或缺。计算机信息技术不断发展,逐渐突破了传统意义上的课程设计,新技术的融合与计算机的更新换代促成
当前,国内畜牧业的迅速发展对基层兽医诊疗水平提出了更高的要求。然而,目前基层兽医诊疗水平的落后局面给国内畜牧业的发展带来了极大地阻力,给动物的健康和食品安全带来了潜在
巴洛克风格起源干意大利,其中法国路易十四式最负盛名。巴洛克家具的造型打破了已往那种规格的沉闷形式,大胆的应用多变的曲线,并摒弃了对建筑装饰的直接模仿,体现出丰满、豪华、
本文依靠灰色数学理论,通过合理采样,预测军用或民用飞机空中运行航迹。其对飞机空中航迹数据要求不高,以较高精度实现对“贫信息”、“小样本”空情数据序列的模拟,科学得出结论
深水表层钻井中钻遇浅层流十分危险,表层动态压井装置是钻遇浅层流问题有效处理手段。本文从原理、特点以及关键装置等方面对ZM-2型动态压井钻井装置进行了介绍,结合工艺流程,通
本文以课堂翻译实践当中出现的常见机构名称为例,讨论这些特有名词翻译方法和策略,总结出汉字音直译与约定俗成两种翻译策略,希望为此类翻译提供可参考的经验。
近年来,高职院校艺术设计专业的毕业设计质量存在一定问题。艺术设计专业的毕业设计是检验高职院校办学质量的重要标准。高职艺术设计类专业培养人才具有一定的独特性,所以对