基于NLP的招聘数据分析平台的分析与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:tony_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,越来越多的求职者倾向于在招聘网站获取招聘信息,有招聘意向的企业也更愿意在招聘网站上发布招聘需求。随着线上招聘逐渐取代线下招聘成为最受欢迎的招聘方式,招聘网站也获得了大量的招聘数据,然而招聘网站却往往忽略了这些招聘数据所隐藏的信息。一些针对招聘数据的研究尝试给出自己的分析结果,但这些结果都是以分析报告的形式给出的,无法将分析结果提供给广大求职者。另一方面,虽然NLP领域内针对简历分析和推荐的研究有很多,但对招聘数据的分析还在起步阶段,这导致了对招聘数据的信息抽取缺乏现有的成熟的范式,招聘数据的信息抽取方案还有待进一步研究。本课题的目标是开发一个基于数据和信息抽取模型的招聘数据分析平台,并且尝试对招聘数据信息抽取做进一步的研究。基于这一目标,本课题进行了以下内容的探索:1.开发了招聘数据爬虫工具,该工具可以实时爬取不同招聘网站最新发布的招聘数据,并能将这些数据存储在Mysq1数据库中。该工具还可以爬取历史招聘数据,使用该工具爬取的1000万+条历史招聘数据是平台的数据来源。2.构建了一个招聘数据分析系统,该系统打通了爬虫、前后端和NLP招聘数据抽取模型。该系统可以用于显示招聘数据的统计分析结果,并提供交互功能用于显示用户感兴趣的统计数据。3.对招聘数据信息抽取方法进行了探索,采用NER模型进行招聘数据中的技能抽取,并对比了传统的技能抽取方法,证明了该方案的有效性。
其他文献
在当前市场经济的激烈竞争下,伴随着互联网、大数据、云计算和物联网等新技术的爆炸式增长,企业所面临的竞争压力持续增加,市场竞争情报分析对企业具有十分重要的意义,竞争情报工作愈加重要,已成为企业在资本、技术、人才之后的第四竞争要素。随着生活水平的提高,家用汽车已走进千家万户,针对目前市场保有率最高,同时也是普通群众接触最为广泛的A级轿车及其国内市场进行竞争情报分析,对企业科学决策具有指导意义,对民众最
随着互联网技术的高速发展,文本数据呈现海量的特征,网络媒体及新媒体平台成为新闻传播事业的重要组成部分,网络新闻成为人们重要的信息来源之一。为了满足大量网络新闻阅读
随着光纤光栅传感技术的迅速发展,光纤光栅传感器由于其具有灵敏度高、抗电磁干扰、体积小、可构建准分布传感网络、耐腐蚀等优点,十分适合于建筑结构的健康监测。增材制造技术俗称3D打印技术,是近30年来得到快速发展的一种先进制造技术,其优势在于三维结构的快速和自由制造。本文提出了一种基于增材制造技术的光纤光栅传感元件的封装方法,设计了两类光纤光栅应变传感器并利用增材制造技术进行封装,推导了其应变传递机理并
当今社会已经进入全面信息化的时代,且智能化科学技术的快速发展对财务工作也提出了更高的要求,若是把会计电算化代替部分人工会计核算比作财务领域第一次变革,大多数企业逐
装配式建筑结构在我国迅速发展,装配式结构的构件破损问题便随之而来,这类破损十分特殊。一方面,破损部位往往发生在立面或顶面,非传统水平作业面,修补位置的特殊性给修补作业带来了一定的麻烦,这就要求修补材料应具有低流动性、凝结硬化速度快和粘结强度高等特点;另一方面,装配式建筑结构构件发生破损,可能会影响装配式结构构件的性能,给施工作业人员安全带来威胁,影响施工验收的质量。装配式建筑结构本身便以施工周期短
预应力高强度混凝土管桩(PHC管桩)具有单桩承载力高、成桩快、运输方便等优点,近些年来被广泛的运用到基坑工程中。PHC管桩大多数是用作桩基础来承担竖向荷载,随着研究的深入,PHC管桩可作为支护结构使用。本文以广东省江门市某一深基坑为例,选用双排PHC管桩作为支护结构体系,探究PHC管桩作为基坑支护结构的受力变形形式,本文的研究内容和成果如下:(1)确定基坑工程的支护方案为双排PHC管桩,通过理正7
学位
随着人们生活水平的提高,农产品质量安全问题逐渐受到关注。目前,我国蔬菜消费需求量庞大,其中设施蔬菜在整个蔬菜消费需求中占据主导地位。农户作为生产者,是确保蔬菜质量安全的源泉,然而实际上农户存在许多不规范施药行为,例如不遵守农药间隔期的规定、不按照说明书浓度要求配比农药等行为,严重影响着蔬菜质量安全。因此,要想保证蔬菜质量安全就必须规范农户施药行为,只有这样才能使我国整体蔬菜质量有所提升,为消费者带
P2P借贷将飞速发展的互联网技术与不断提升的民间借贷需求有机结合,满足了小额借贷双方对于资金的不同需求,提高了民间资本的利用效率,并完善了国内信贷体系,但近年来,行业不断发生大额坏账现象及平台卷钱跑路等金融风险事件。借贷平台频发风险事件,使得规范平台发展,控制P2P行业风险成为社会各界关注的焦点。首先对P2P借贷平台运营过程中的风险状况以及行业存在问题进行了分析,并从外部管控与内部管控两个维度对我
作为进军企业客户,解决企业供应链难题的产品,JD集团对R项目给予厚望。然而,由于涉及的功能覆盖面广,同时还引入了大量的新技术,使得系统设计变得及其复杂。作为一个以研发技术为主的软件类项目,如何有效控制风险是项目关注的重点。项目能否成功决定了 JD集团进军企业级市场的成败。传统的风险管理手段在软件类项目中的应用出现了很多不足。如在项目中如何更好的针对已识别的风险评估其彼此间的依赖关系;彼此之间的影响
随着科技的不断发展,汽车悬架技术在不断的进步,但人对于汽车的舒适个性、稳定性和操控性的要求也越高。汽车主动悬架可以满足人的要求,它的特点是提升车辆平顺性,可以根据外界因素适时地调节整车悬架的阻尼和刚度,使车辆能够处于最佳的减振状态达到最高的乘坐舒适性。因此,提升车辆平顺性是汽车主动悬架的研究热点。本文设计了三级减振式主动悬架结构,通过增加隔振改变悬架特性,达到提升车辆平顺性和悬架布置灵活性,减少主