论文部分内容阅读
目前,职业技能领域的研究内容虽然十分广泛,但就可查阅的文献来看,现有研究工作较少从职业技能本身出发,基于海量数据探讨职业技能之间的内在关系,也均未涉及到对职业技能个体间的关联与聚类特征的研究。大量社交网络的出现及其广泛应用为该项研究工作提供了基础,如全球职业社交网站Linked In(领英),注册会员众多,并且会员注册时通常会提供个人的职业技能信息,这为职业技能个体间的关联与聚类特征研究提供了条件。基于现有的研究成果,本文做了年龄估计,职业技能关联规则挖掘,职业技能分类,主要包括以下工作:(1)本文提出了一种面向成长模型的Linked In社交网络中成员的年龄预测方法。为了更加准确地预测Linked In社交网络成员的年龄,该方法先提取出Linked In社交网络成员的教育经历和工作经历,然后根据成长模型来预测成员的年龄。该方法解决了人脸识别年龄预测方法由于图片年代信息不详所导致的年龄误差,大大增加了年龄预测的准确率。(2)本文从Linked In(领英)职业社交网络平台上采集数万名会员的职业技能数据,并对这些数据进行预处理和标准化,然后采用大数据关联与聚类分析的理论和方法,挖掘了职业技能之间的关联与聚类特征。研究发现,人类的职业技能之间的确存在着大量的聚类与关联关系,并且部分关联关系置信度、提升度和支持度极高,这说明人类职业技能之间有着某些内在的固定联系。(3)本文改进了距离计算方法,并将其用于改进K-means++聚类算法。然后为每一个职业技能产生一条职业技能生命曲线,并利用改进后的聚类算法对职业技能按照生命曲线相似度进行聚类,将产生的结果与未改进的聚类算法产生的结果进行对比有明显的改善。本文的研究工作能够揭示不同职业技能之间内在的关联和依赖关系,以及职业技能生命周期特征等,研究成果能够为职业技能领域其他方面的研究,如职业技能培训、职业技能挖掘、职业技能鉴定等,提供理论支持,也可以为个人就业择业和公司招聘提供参考依据。