基于BiLSTM和XGBoost的人岗匹配方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:dluflonline
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络招聘是现阶段主流的招聘形式之一,发挥着连接求职者和招聘者的桥梁作用。人岗匹配是网络招聘中的一个重点研究问题。得益于自然语言处理技术的发展,已有人岗匹配研究大多基于岗位的岗位描述和求职者的工作经历这两个文本型特征建立模型。一方面,这些研究没有考虑到其他类型的文本数据,例如,职位子类和岗位浏览记录;另一方面,求职者的应聘过程是“浏览岗位→投递简历→招聘者是否认可”,已有研究没有考虑到求职者前序行为对后续应聘结果的影响。本文立足于网络招聘平台视角构建人岗匹配模型,包括基于BiLSTM的岗位和简历文本相似度计算以及基于XGBoost的人岗匹配建模两个阶段。论文的主要研究内容如下:(1)提出了一种基于BiLSTM的岗位和简历文本相似度计算方法。首先,本文从招聘平台视角出发,对岗位和简历文本相似度计算问题进行了形式化描述和定义。其次,对提出的岗位和简历文本相似度计算模型的构建方法进行了说明,包括基于BiLSTM的岗位描述特征表示、融合岗位浏览记录的工作经历特征表示、职位子类特征表示以及岗位和简历文本相似度计算。与以往研究不同的是,本文还考虑了岗位浏览记录、职位子类和期望职位子类特征,旨在挖掘求职者对岗位的偏好、丰富岗位和简历的表示。然后,在人岗匹配数据集上进行了验证,数值实验结果表明本文提出的模型是有效的,消融实验表明了考虑到岗位浏览记录、职位子类和期望职位子类特征的有效性。最后,为了说明模型有助于提升招聘平台的服务效率,进行了实例分析。(2)提出了一种基于XGBoost的人岗匹配方法。首先,本文对人岗匹配问题进行了形式化描述和定义。其次,对提出的人岗匹配模型的构建方法进行了说明,包括岗位和简历的原始特征分析、特征构建和人岗匹配预测三个步骤。原始特征分析步骤对岗位和简历的原始特征进行了分析和预处理;特征构建步骤从“求职者与目标岗位的相似度”及“求职者在申请同一岗位的候选人中的竞争力”两个角度构建的11个特征,岗位和简历的文本相似度是其中的一个重要特征;人岗匹配步骤将特征输入到XGboost模型计算人岗匹配度。然后,为了验证本文提出的人岗匹配模型的有效性,数值实验部分将本文提出的模型与采用其它几种机器学习方法的模型进行了对比,并采用消融实验方法对构建的特征的有效性进行了分析。实验结果表明,本文提出的人岗匹配模型是有效的,且本文构建的特征能够提高预测模型的精度。最后,为了说明运用模型进行人岗匹配的效果,进行了实例分析。
其他文献
随着国家颁布了系列慢行交通发展政策,以自行车为代表的绿色交通的理念越来越得到广大居民的认可。然而,城市非机动车道受机动车流影响,其空间受限,同时非机动车间存在较强的冲突干扰,严重影响其通行安全与运行效率。本文以西安市的城市非机动车道为试验区域,对发生避让冲突的自行车群体进行采样,调查采集道路环境、车群规模、位置分布、速度位移等信息,对冲突干扰环境下的非机动车避让特性进行分析。构建避让轨迹预测模型和
猪繁殖与呼吸综合征(Porcine reproductive and respiratory syndrome,PRRS),是由猪繁殖与综合征病毒引起的,能够导致妊娠母猪流产、仔猪呼吸道症状,且高死亡率的一种病毒性传染病,俗称蓝耳病。自该病被发现以来人们意识到其临床症状在个体间具有很大的差异性,PRRSV不产生特殊的临床症状,其表现的临床症状反映的是PRRSV的毒力,猪的年龄、免疫状态以及并发感染
城市最基本的特征是人的活动,最富有活力的空间是城市公共空间,社区中的公共空间作为城市公共空间体系一部分,是居民健康活动最直接的空间载体,与公共健康有着密切的关联。疫情未艾,国家、政府、专家甚或普通的居民都对其公共健康问题提出再度审视,人与环境如何融合共生?纵观其发展溯源,公共空间作为社区的公共领域,经历了从无到有的发展过程,在空间组织层面从“单一维度”递升发展到“多维融合”,在行为活动层面从“消极
ZnO量子点(ZnO QDs)存在制备过程不稳定、发光强度较弱以及光谱调制困难的问题,本文分别对每个问题开展研究。第一,本文研究了ZnO量子点的稳定制备技术,稳定合成了无壳ZnO量子点方法,量子点的光致发光光谱具备所需的各个波段;第二,本文合成了高发光强度ZnO-MgO核壳结构量子点,发光强度大大增强,扩展了ZnO量子点光谱范围;第三,本文研究了ZnO量子点的新制备方法,对ZnO量子点的发光进行光
传统广告时代,广告的制作与发布处于某种垄断地位。社会化媒体的出现打破了这种垄断,使广告真正脱离了“一些人”进入了“全民时代”,在社会化媒体平台,每个人都可以为自己或为自己服务的集团做广告,尤其短视频的视听功能和平台特性为广告的内容制作与推广提供了更加广阔的空间。但在新媒体环境下,信息的碎片化带来受众观看习惯的碎片化,注意力成为稀缺资源,广告仅要留住受众的目光就已异常艰难,毋宁说要让受众接受且认可广
随着互联网、云计算、大数据和人工智能等技术的不断成熟,港口行业也在迈入与信息化深度融合、向智能化跨越发展的新时代。当前,全国各大港口延续了良好的发展态势,货物吞吐量、集装箱吞吐量增长明显。但从长远来看,要持续提高港口行业的竞争力,必须改变传统的港口管理和作业模式,尤其是在集装箱装卸方面,积极引入智能化管理的技术和方法,从而实现大型集装箱码头的提能降耗和作业优化。本文对集装箱装卸智能化问题进行了深入
[目的]本实验研究天麻素对人肝癌HepG-2细胞的增殖、迁移侵袭、细胞凋亡、细胞周期的影响,并探究天麻素诱导人肝癌HepG-2细胞凋亡和抑制细胞增殖的作用机制。[方法]用CCK-8法检测天麻素对人肝癌HepG-2细胞增殖的影响,并计算天麻素作用人肝癌HepG-2细胞的IC50值;用细胞克隆形成实验再次验证天麻素对人肝癌HepG-2细胞的增殖影响;细胞划痕实验验证天麻素对人肝癌HepG-2细胞迁移的
我国是全球汽车生产和消费的第一大国,汽车已成为家家户户必备的交通出行工具之一。随着科学技术的发展和进步,汽车产品力不断提升,汽车方向盘作为汽车产品上用户直接接触与操控的重要部件,具有重要的创新设计与研究意义。本文通过对汽车方向盘进行解析,从造型与结构、CMF设计等角度分析汽车方向盘设计,介绍了未来概念汽车方向盘,叙述了汽车方向盘整体现状。探讨总结出人工智能技术的发展与介入,汽车座舱智能化和汽车网联
阅读是人类认知世界的窗口。绘本是教育界公认的儿童早期教育的最佳读物,儿童时期阅读经验和阅读习惯的养成对其一生的发展至关重要。图文并茂的绘本产生的“吸引力”是儿童阅读习惯养成的基础,实践验证绘本馆是儿童早期认识世界接受知识教育的重要场所之一,它不仅可以为儿童提供丰富的可读性绘本,其绘本馆的环境空间的合理营造也能增强孩子们的功能阅读收效。对于儿童绘本教育的社会化、规模化的发展及亲子关系的培养等问题,应
在我国经济发展水平日益提高,人民群众美好生活需求日益突出的时代背景下,为加快推进我国社会主义现代化进程,构建社会共同价值体系,我国提出建设新时代文明实践中心。然而,在实践过程中,新时代文明实践中心缺乏对于新时代文明实践中心建设工作的明晰定位,难以彰显新时代文明实践中心建设的社会意义。因此,本文采用案例研究法,以竹山县新时代文明实践中心作为研究案例,对其进行深入研究,以为其它新时代文明实践中心的建设